Перейти к содержимому

Как использовать GProxy proxy с Octoparse

TL;DR

Настройте GProxy proxy в Octoparse для визуального веб-скрейпинга. Пошаговая настройка proxy в GUI Octoparse, параметры ротации и лучшие практики.

Язык: No-Code

Что вам понадобится

  • Десктопное приложение или облачный аккаунт Octoparse
  • Аккаунт GProxy с активным тарифным планом proxy
  • URL целевого сайта для парсинга

Пошаговая настройка

1

Открыть настройки Octoparse

Перейдите в настройки proxy

Octoparse → Settings → Proxy Settings
2

Добавить GProxy как кастомный proxy

Введите данные proxy GProxy

Proxy Type: HTTP
Address: proxy.gproxy.net
Port: 1000
Username: YOUR_USER
Password: YOUR_PASS
3

Настроить ротацию

Установите частоту ротации proxy

Rotation Mode: Per Request (or every N requests)
Timeout: 30 seconds
Retry on failure: Enabled
4

Добавить гео-таргетированные proxy

Добавьте записи для конкретных стран для локализованного скрапинга

Proxy 1: USER-country-us:PASS@proxy.gproxy.net:1000
Proxy 2: USER-country-de:PASS@proxy.gproxy.net:1000
Proxy 3: USER-country-gb:PASS@proxy.gproxy.net:1000
5

Создать задачу скрапинга

Создайте рабочий процесс скрапинга с включенным proxy

New Task → Enter URL → Select data fields → Enable proxy → Run
6

Протестировать и проверить

Запустите тестовое извлечение, чтобы убедиться, что proxy работает

Run task in local mode → Check extraction results → Verify no blocks

Примеры кода

Конфигурация Octoparse Proxy · text
Proxy Settings:
  Type: HTTP
  Server: proxy.gproxy.net
  Port: 1000
  Authentication: Enabled
  Username: YOUR_GPROXY_USER
  Password: YOUR_GPROXY_PASS
  
Rotation:
  Mode: Rotate per request
  Timeout: 30s
  Max retries: 3
Список Bulk Proxy для Geo-Targeting · text
# Add these as separate proxy entries in Octoparse
# Each targets a different country
http://USER-country-us:PASS@proxy.gproxy.net:1000
http://USER-country-gb:PASS@proxy.gproxy.net:1000
http://USER-country-de:PASS@proxy.gproxy.net:1000
http://USER-country-fr:PASS@proxy.gproxy.net:1000
http://USER-country-jp:PASS@proxy.gproxy.net:1000
http://USER-country-br:PASS@proxy.gproxy.net:1000
http://USER-country-au:PASS@proxy.gproxy.net:1000
http://USER-country-ca:PASS@proxy.gproxy.net:1000

Почему стоит использовать GProxy с Octoparse?

Octoparse — это популярный инструмент для веб-скрейпинга без кода с визуальным интерфейсом point-and-click. Хотя Octoparse предлагает встроенную ротацию IP, использование GProxy в качестве внешнего proxy дает вам доступ к 10M+ резидентным IP в 150+ странах — это гораздо большее разнообразие IP, чем в стандартном пуле Octoparse. Это значительно снижает количество блокировок и CAPTCHAs при работе со сложными целями.

Добавление GProxy proxy в Octoparse

Octoparse поддерживает настройку кастомных proxy через панель Settings. Вы можете добавить endpoint от GProxy как кастомный proxy, указав учетные данные для аутентификации. После настройки Octoparse будет направлять все запросы на скрейпинг через сеть GProxy.

Настройки ротации proxy

Настройте частоту, с которой Octoparse переключается между IP от GProxy. С backconnect proxy от GProxy каждое новое соединение автоматически получает свежий IP. Установите интервал ротации в Octoparse в соответствии с вашим темпом скрейпинга — обычно каждые 1-5 запросов для чувствительных сайтов.

Скрейпинг с гео-таргетингом

Для сбора данных с привязкой к местоположению используйте функцию гео-таргетинга GProxy. Добавьте в Octoparse записи proxy для конкретных стран, чтобы направлять запросы через IP в определенных регионах. Это необходимо для сбора локализованных цен в e-commerce, результатов поиска или контента с региональными ограничениями.

Облачное и локальное выполнение

Octoparse запускает задачи локально или в облаке. Для локального выполнения настройте proxy в десктопном приложении. Для облачного выполнения добавьте настройки proxy в конфигурацию задачи перед загрузкой. GProxy работает в обоих режимах.

Обход анти-бот защиты

Сочетайте резидентные proxy от GProxy со встроенной эмуляцией браузера Octoparse для достижения максимального успеха. Резидентные IP значительно сложнее обнаружить, чем серверные IP, а визуальный рендеринг браузера в Octoparse справляется с сайтами с большим количеством JavaScript, которые не под силу обычному HTTP скрейпингу.

Сценарии применения

E-commerce Data Extraction

Парсинг списков товаров, цен и отзывов с крупнейших e-commerce платформ с использованием residential proxies.

Real Estate Listings

Сбор объявлений о недвижимости с порталов с использованием geo-targeted proxies для получения локализованных результатов.

Job Board Scraping

Агрегация вакансий с нескольких платформ с использованием rotating IPs для обхода блокировок.

Review Monitoring

Отслеживание отзывов клиентов на различных платформах для анализа тональности и мониторинга бренда.

Pro советы
Используйте единый backconnect endpoint от GProxy вместо ввода нескольких proxy — он ротируется автоматически. Установите в Octoparse таймаут загрузки страницы на 30s для proxy соединений. Начните с residential proxies для новых целей, переключитесь на datacenter, если блокировки не являются проблемой. Экспортируйте и сохраните вашу конфигурацию proxy для повторного использования в других задачах.

FAQ

Поддерживает ли Octoparse SOCKS5 прокси? +
Octoparse в первую очередь поддерживает HTTP/HTTPS прокси. Используйте HTTP эндпоинт GProxy (порт 1000) для полной совместимости.
Могу ли я использовать GProxy с облаком Octoparse? +
Да, добавьте конфигурацию прокси в настройки вашей задачи перед загрузкой для выполнения в облаке.
Сколько прокси я могу добавить в Octoparse? +
Octoparse поддерживает несколько записей прокси. С backconnect эндпоинтом GProxy одна запись автоматически управляет ротацией.
Будет ли GProxy работать с защитой от обнаружения Octoparse? +
Да, резидентные IP от GProxy дополняют встроенную эмуляцию браузера Octoparse для максимальной скрытности.

Готовы попробовать?

Начните с GProxy за минуты — резидентные прокси от $0.85/GB, IPv6 от $0.03/прокси, оплата по факту использования.

Другие интеграции

GProxy + Puppeteer
Настройте GProxy proxy с Puppeteer для автоматизации headless Chrome. Рассматриваются proxy authentication, переключение proxy на уровне page и stealth техники.
GProxy + Selenium
Настройте GProxy proxy с Selenium WebDriver для автоматизации браузера и парсинга. Охватывает Chrome, Firefox, headless режим и proxy аутентификацию.
GProxy + Scrapy
Узнайте, как настроить GProxy residential и datacenter proxy с Scrapy для крупномасштабного web scraping. Рассматриваются настройка middleware, rotation proxy и обработка ошибок.
GProxy + cURL
Используйте GProxy proxy с cURL для HTTP-запросов через командную строку. Охватывает типы proxy HTTP, HTTPS, SOCKS5, аутентификацию и продвинутые опции.
GProxy + Postman
Настройте GProxy proxy в Postman для API тестирования из различных локаций. Охватывает глобальные proxy settings, конфигурацию per-request и environment variables.
GProxy + n8n
Направляйте HTTP requests из workflow n8n через GProxy proxy. Охватывает конфигурацию HTTP Request node, environment variables и паттерны автоматизации.
support_agent
GProxy Support
Usually replies within minutes
Hi there!
Send us a message and we'll reply as soon as possible.