So verwenden Sie Proxies mit Playwright: Complete Guide

TL;DR

Konfigurieren Sie GProxy proxies mit Playwright für die browserübergreifende Automatisierung. Unterstützt proxy-Wechsel pro Kontext, Chrome/Firefox/WebKit und integrierte Authentifizierung.

Proxies erhalten → Playwright Website →

Sprache: Python / JavaScript

Voraussetzungen

✓Python 3.8+ oder Node.js 16+
✓Playwright installiert (pip install playwright && playwright install)
✓GProxy-Account mit aktivem Proxy-Plan
✓Vertrautheit mit async/await-Mustern

Schritt-für-Schritt-Einrichtung

Playwright installieren

Playwright und Browser-Binärdateien installieren

# Python
pip install playwright
playwright install chromium

# Node.js
npm install playwright

Mit proxy starten

Einen Browser-Kontext mit GProxy proxy erstellen

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    context = browser.new_context(proxy={
        'server': 'http://proxy.gproxy.net:1000',
        'username': 'YOUR_USER',
        'password': 'YOUR_PASS'
    })
    page = context.new_page()
    page.goto('https://httpbin.org/ip')
    print(page.content())

Rotation pro Kontext

Verwenden Sie verschiedene proxies pro Kontext für die Rotation

countries = ['us', 'de', 'gb', 'fr']
for country in countries:
    ctx = browser.new_context(proxy={
        'server': 'http://proxy.gproxy.net:1000',
        'username': f'USER-country-{country}',
        'password': 'PASS'
    })
    page = ctx.new_page()
    page.goto('https://httpbin.org/ip')
    print(f'{country}: {page.text_content("body")}')
    ctx.close()

Geo-Location-Emulation hinzufügen

Kombinieren Sie proxy mit Locale und Zeitzone für eine vollständige Geo-Simulation

context = browser.new_context(
    proxy={'server': 'http://proxy.gproxy.net:1000',
           'username': 'USER-country-us', 'password': 'PASS'},
    locale='en-US',
    timezone_id='America/New_York',
    geolocation={'latitude': 40.7128, 'longitude': -74.0060},
    permissions=['geolocation']
)

Paralleles Scraping ausführen

Mehrere Seiten gleichzeitig mit verschiedenen proxies scrapen

import asyncio
from playwright.async_api import async_playwright

async def scrape(browser, url, country):
    ctx = await browser.new_context(proxy={
        'server': 'http://proxy.gproxy.net:1000',
        'username': f'USER-country-{country}',
        'password': 'PASS'
    })
    page = await ctx.new_page()
    await page.goto(url)
    title = await page.title()
    await ctx.close()
    return title

Codebeispiele

Python Sync API mit GProxy · python

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)
    context = browser.new_context(
        proxy={
            'server': 'http://proxy.gproxy.net:1000',
            'username': 'YOUR_USER',
            'password': 'YOUR_PASS'
        }
    )
    page = context.new_page()
    page.goto('https://httpbin.org/ip')
    print('IP:', page.text_content('body'))
    context.close()
    browser.close()

Async Paralleles Scraping · python

import asyncio
from playwright.async_api import async_playwright

async def scrape_page(browser, url, country):
    context = await browser.new_context(proxy={
        'server': 'http://proxy.gproxy.net:1000',
        'username': f'USER-country-{country}',
        'password': 'PASS'
    })
    page = await context.new_page()
    await page.goto(url, timeout=30000)
    data = await page.evaluate('() => document.title')
    await context.close()
    return {'url': url, 'country': country, 'title': data}

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch()
        tasks = [
            scrape_page(browser, 'https://example.com', 'us'),
            scrape_page(browser, 'https://example.com', 'de'),
            scrape_page(browser, 'https://example.com', 'jp'),
        ]
        results = await asyncio.gather(*tasks)
        print(results)
        await browser.close()

asyncio.run(main())

Node.js mit GProxy · javascript

const { chromium } = require('playwright');

(async () => {
  const browser = await chromium.launch();
  const context = await browser.newContext({
    proxy: {
      server: 'http://proxy.gproxy.net:1000',
      username: 'YOUR_USER',
      password: 'YOUR_PASS'
    }
  });

  const page = await context.newPage();
  await page.goto('https://httpbin.org/ip');
  console.log(await page.textContent('body'));

  await context.close();
  await browser.close();
})();

Warum Playwright für Proxy-basiertes Scraping?

Playwright von Microsoft ist das modernste Framework für Browser-Automatisierung und unterstützt Chromium, Firefox und WebKit über eine einzige API. Sein entscheidendes Feature für Proxy-Nutzer: nativer Support für Proxies pro Kontext. Im Gegensatz zu Puppeteer und Selenium können Sie verschiedene Proxies für verschiedene Browser-Kontexte festlegen, ohne neue Browser-Instanzen zu starten. In Kombination mit den über 10M+ Residential IPs von GProxy macht dies Playwright zur schnellsten Option für gleichzeitiges geo-targeted Scraping.

Proxy-Konfiguration pro Kontext

Die Browser-Kontexte von Playwright sind leichtgewichtige, isolierte Umgebungen, die jeweils eigene Proxy-Einstellungen haben können. Erstellen Sie einen Kontext mit einem GProxy-Proxy, führen Sie Ihr Scraping durch, schließen Sie ihn und erstellen Sie einen weiteren mit einem anderen Proxy — alles innerhalb derselben Browser-Instanz. Dies ist wesentlich effizienter als der Ansatz von Selenium oder Puppeteer.

Integrierte Authentifizierung

Playwright verarbeitet die HTTP-Proxy-Authentifizierung nativ über die Proxy-Konfiguration. Übergeben Sie Benutzername und Passwort direkt in der Proxy-Konfiguration — keine Browser-Erweiterungen oder Workarounds erforderlich. Dies funktioniert konsistent über Chromium, Firefox und WebKit hinweg.

Multi-Browser-Unterstützung

Testen und scrapen Sie mit verschiedenen Browser-Engines unter Verwendung desselben Codes. Chromium für die meisten Aufgaben, Firefox für Websites, die Chrome-basierte Automatisierung blockieren, und WebKit für Safari-ähnliches Verhalten. Alle unterstützen GProxy-Proxies über dieselbe Konfigurations-API.

Geo-Targeting mit Playwright

Kombinieren Sie die länderbezogenen Proxies von GProxy mit den integrierten Geolocation- und Locale-Einstellungen von Playwright für eine vollständige Standortsimulation. Stellen Sie den Proxy auf eine US-IP, das Locale auf en-US, die Zeitzone auf America/New_York und die Geolocation auf New York-Koordinaten ein, um ein völlig konsistentes US-Benutzerprofil zu erhalten.

Paralleles Scraping im großen Stil

Die Architektur von Playwright unterstützt hohe Nebenläufigkeit bei minimalem Ressourcenverbrauch. Erstellen Sie Dutzende von Browser-Kontexten mit verschiedenen GProxy-Proxies, die parallel innerhalb einer einzigen Browser-Instanz laufen. Jeder Kontext ist mit eigenen Cookies, Speichern und Proxies isoliert — ideal für die Datenerfassung in großem Maßstab.

Anwendungsfälle

Cross-Browser Testing

Testen Sie Websites von verschiedenen Standorten aus mit Chromium, Firefox und WebKit unter Verwendung von geo-targeted Proxies.

Competitive Intelligence

Überwachen Sie Wettbewerber-Websites über Regionen hinweg mit per-context Proxy-Rotation und Locale-Emulation.

Ad Verification

Verifizieren Sie Anzeigenplatzierungen und Inhalte in verschiedenen Ländern unter Verwendung von gezielten residential IPs.

Dynamic Content Scraping

Extrahieren Sie Daten von JavaScript-lastigen Websites mit vollständigem Browser-Rendering und zuverlässiger Proxy-Rotation.

Profi-Tipps

Verwenden Sie Browser-Kontexte anstelle von neuen Browsern — sie sind 10x schneller zu erstellen und unterstützen pro-Kontext-proxies. Kombinieren Sie proxy mit locale, timezone und geolocation für eine vollständige Geo-Simulation. Verwenden Sie route(), um Ressourcen zu blockieren, anstatt request interception für saubereren Code zu nutzen. Das codegen-Tool von Playwright kann Interaktionen aufzeichnen und proxy-kompatible Skripte generieren.

FAQ

Kann ich verschiedene Proxys pro Seite verwenden? +

Ja! Playwright unterstützt die Proxy-Konfiguration pro Kontext. Erstellen Sie für jede Aufgabe einen neuen Kontext mit einem anderen Proxy — dies ist der entscheidende Vorteil von Playwright gegenüber Selenium und Puppeteer.

Funktioniert Playwright mit SOCKS5? +

Ja, Playwright unterstützt SOCKS5 Proxys nativ. Verwenden Sie 'socks5://host:port' als Server-URL in der Proxy-Konfiguration.

Welchen Browser sollte ich für Scraping verwenden? +

Chromium für die meisten Aufgaben. Firefox, wenn Websites Chrome-basierte Bots blockieren. WebKit für das Testen von iOS Safari-Verhalten.

Ist Playwright schneller als Puppeteer? +

Ähnliche Performance bei Aufgaben auf einer einzelnen Seite. Playwright ist schneller beim gleichzeitigen Scraping, da Proxys pro Kontext das Starten mehrerer Browser vermeiden.