So verwenden Sie Proxies mit Playwright: Complete Guide
Konfigurieren Sie GProxy proxies mit Playwright für die browserübergreifende Automatisierung. Unterstützt proxy-Wechsel pro Kontext, Chrome/Firefox/WebKit und integrierte Authentifizierung.
Voraussetzungen
- ✓Python 3.8+ oder Node.js 16+
- ✓Playwright installiert (pip install playwright && playwright install)
- ✓GProxy-Account mit aktivem Proxy-Plan
- ✓Vertrautheit mit async/await-Mustern
Schritt-für-Schritt-Einrichtung
Playwright installieren
Playwright und Browser-Binärdateien installieren
# Python
pip install playwright
playwright install chromium
# Node.js
npm install playwright
Mit proxy starten
Einen Browser-Kontext mit GProxy proxy erstellen
from playwright.sync_api import sync_playwright
with sync_playwright() as p:
browser = p.chromium.launch()
context = browser.new_context(proxy={
'server': 'http://proxy.gproxy.net:1000',
'username': 'YOUR_USER',
'password': 'YOUR_PASS'
})
page = context.new_page()
page.goto('https://httpbin.org/ip')
print(page.content())
Rotation pro Kontext
Verwenden Sie verschiedene proxies pro Kontext für die Rotation
countries = ['us', 'de', 'gb', 'fr']
for country in countries:
ctx = browser.new_context(proxy={
'server': 'http://proxy.gproxy.net:1000',
'username': f'USER-country-{country}',
'password': 'PASS'
})
page = ctx.new_page()
page.goto('https://httpbin.org/ip')
print(f'{country}: {page.text_content("body")}')
ctx.close()
Geo-Location-Emulation hinzufügen
Kombinieren Sie proxy mit Locale und Zeitzone für eine vollständige Geo-Simulation
context = browser.new_context(
proxy={'server': 'http://proxy.gproxy.net:1000',
'username': 'USER-country-us', 'password': 'PASS'},
locale='en-US',
timezone_id='America/New_York',
geolocation={'latitude': 40.7128, 'longitude': -74.0060},
permissions=['geolocation']
)
Paralleles Scraping ausführen
Mehrere Seiten gleichzeitig mit verschiedenen proxies scrapen
import asyncio
from playwright.async_api import async_playwright
async def scrape(browser, url, country):
ctx = await browser.new_context(proxy={
'server': 'http://proxy.gproxy.net:1000',
'username': f'USER-country-{country}',
'password': 'PASS'
})
page = await ctx.new_page()
await page.goto(url)
title = await page.title()
await ctx.close()
return title
Codebeispiele
from playwright.sync_api import sync_playwright
with sync_playwright() as p:
browser = p.chromium.launch(headless=True)
context = browser.new_context(
proxy={
'server': 'http://proxy.gproxy.net:1000',
'username': 'YOUR_USER',
'password': 'YOUR_PASS'
}
)
page = context.new_page()
page.goto('https://httpbin.org/ip')
print('IP:', page.text_content('body'))
context.close()
browser.close()
import asyncio
from playwright.async_api import async_playwright
async def scrape_page(browser, url, country):
context = await browser.new_context(proxy={
'server': 'http://proxy.gproxy.net:1000',
'username': f'USER-country-{country}',
'password': 'PASS'
})
page = await context.new_page()
await page.goto(url, timeout=30000)
data = await page.evaluate('() => document.title')
await context.close()
return {'url': url, 'country': country, 'title': data}
async def main():
async with async_playwright() as p:
browser = await p.chromium.launch()
tasks = [
scrape_page(browser, 'https://example.com', 'us'),
scrape_page(browser, 'https://example.com', 'de'),
scrape_page(browser, 'https://example.com', 'jp'),
]
results = await asyncio.gather(*tasks)
print(results)
await browser.close()
asyncio.run(main())
const { chromium } = require('playwright');
(async () => {
const browser = await chromium.launch();
const context = await browser.newContext({
proxy: {
server: 'http://proxy.gproxy.net:1000',
username: 'YOUR_USER',
password: 'YOUR_PASS'
}
});
const page = await context.newPage();
await page.goto('https://httpbin.org/ip');
console.log(await page.textContent('body'));
await context.close();
await browser.close();
})();
Warum Playwright für Proxy-basiertes Scraping?
Playwright von Microsoft ist das modernste Framework für Browser-Automatisierung und unterstützt Chromium, Firefox und WebKit über eine einzige API. Sein entscheidendes Feature für Proxy-Nutzer: nativer Support für Proxies pro Kontext. Im Gegensatz zu Puppeteer und Selenium können Sie verschiedene Proxies für verschiedene Browser-Kontexte festlegen, ohne neue Browser-Instanzen zu starten. In Kombination mit den über 10M+ Residential IPs von GProxy macht dies Playwright zur schnellsten Option für gleichzeitiges geo-targeted Scraping.
Proxy-Konfiguration pro Kontext
Die Browser-Kontexte von Playwright sind leichtgewichtige, isolierte Umgebungen, die jeweils eigene Proxy-Einstellungen haben können. Erstellen Sie einen Kontext mit einem GProxy-Proxy, führen Sie Ihr Scraping durch, schließen Sie ihn und erstellen Sie einen weiteren mit einem anderen Proxy — alles innerhalb derselben Browser-Instanz. Dies ist wesentlich effizienter als der Ansatz von Selenium oder Puppeteer.
Integrierte Authentifizierung
Playwright verarbeitet die HTTP-Proxy-Authentifizierung nativ über die Proxy-Konfiguration. Übergeben Sie Benutzername und Passwort direkt in der Proxy-Konfiguration — keine Browser-Erweiterungen oder Workarounds erforderlich. Dies funktioniert konsistent über Chromium, Firefox und WebKit hinweg.
Multi-Browser-Unterstützung
Testen und scrapen Sie mit verschiedenen Browser-Engines unter Verwendung desselben Codes. Chromium für die meisten Aufgaben, Firefox für Websites, die Chrome-basierte Automatisierung blockieren, und WebKit für Safari-ähnliches Verhalten. Alle unterstützen GProxy-Proxies über dieselbe Konfigurations-API.
Geo-Targeting mit Playwright
Kombinieren Sie die länderbezogenen Proxies von GProxy mit den integrierten Geolocation- und Locale-Einstellungen von Playwright für eine vollständige Standortsimulation. Stellen Sie den Proxy auf eine US-IP, das Locale auf en-US, die Zeitzone auf America/New_York und die Geolocation auf New York-Koordinaten ein, um ein völlig konsistentes US-Benutzerprofil zu erhalten.
Paralleles Scraping im großen Stil
Die Architektur von Playwright unterstützt hohe Nebenläufigkeit bei minimalem Ressourcenverbrauch. Erstellen Sie Dutzende von Browser-Kontexten mit verschiedenen GProxy-Proxies, die parallel innerhalb einer einzigen Browser-Instanz laufen. Jeder Kontext ist mit eigenen Cookies, Speichern und Proxies isoliert — ideal für die Datenerfassung in großem Maßstab.
Anwendungsfälle
Cross-Browser Testing
Testen Sie Websites von verschiedenen Standorten aus mit Chromium, Firefox und WebKit unter Verwendung von geo-targeted Proxies.
Competitive Intelligence
Überwachen Sie Wettbewerber-Websites über Regionen hinweg mit per-context Proxy-Rotation und Locale-Emulation.
Ad Verification
Verifizieren Sie Anzeigenplatzierungen und Inhalte in verschiedenen Ländern unter Verwendung von gezielten residential IPs.
Dynamic Content Scraping
Extrahieren Sie Daten von JavaScript-lastigen Websites mit vollständigem Browser-Rendering und zuverlässiger Proxy-Rotation.
FAQ
Kann ich verschiedene Proxys pro Seite verwenden? +
Funktioniert Playwright mit SOCKS5? +
Welchen Browser sollte ich für Scraping verwenden? +
Ist Playwright schneller als Puppeteer? +
Bereit loszulegen?
Starten Sie mit GProxy in Minuten — Residential-Proxies ab $0,85/GB, IPv6 ab $0,03/Proxy, nutzungsbasierte Abrechnung.
