Scrapling Stealth: scrapea webs con Cloudflare desde Claude Code
Una librería Python que se salta Cloudflare Turnstile y va ~784x más rápida que BeautifulSoup. Con el snippet listo para enchufar a Claude Code.
- #claude-code
- #python
- #scraping
- #cloudflare
Le pides a Claude Code que scrapee una web y Cloudflare le corta el paso. Scrapling es una librería Python (43.5k stars, BSD-3-Clause) que resuelve Turnstile/Interstitial automáticamente y, según el benchmark del propio repo (5000 elementos anidados), va ~784x más rápida que BeautifulSoup+Lxml.
Instalación
Dos comandos. El primero instala los fetchers, el segundo descarga los binarios de navegador que usa el modo stealth.
pip install "scrapling[fetchers]"
scrapling install
Snippet base
Cinco líneas. Importas StealthyFetcher, le pasas la URL con solve_cloudflare=True y parseas el resultado con selectores CSS.
from scrapling.fetchers import StealthyFetcher
page = StealthyFetcher.fetch(
'https://nopecha.com/demo/cloudflare',
solve_cloudflare=True,
headless=True,
)
data = page.css('#padded_content a').getall()
StealthyFetcher es el módulo que hace la petición saltándose la protección anti-bot. solve_cloudflare=True resuelve el challenge (Turnstile/Interstitial) automáticamente antes de devolverte el HTML.
Cómo enchufarlo a Claude Code
El truco: dejar el snippet en un archivo .py dentro del proyecto y referenciarlo en tu CLAUDE.md como herramienta disponible para scraping. Así cuando le pidas a Claude Code “extrae los enlaces de esta web”, en vez de tirar de requests + BeautifulSoup y comerse un 403, invoca el script con StealthyFetcher y sale a la primera.
Patrón mínimo:
- Guarda el snippet de arriba en
scripts/scrape.py. - En tu
CLAUDE.mdañade una línea: “Para scraping de webs con protección Cloudflare, usarscripts/scrape.py(StealthyFetcher de Scrapling).” - A partir de ahí, Claude Code lo invoca cuando lo necesita.
Honestidad técnica
El bypass de Cloudflare funciona en muchos casos, pero no es magia infinita. Sitios con WAF agresivo o Turnstile en modo Managed pueden seguir bloqueando. Mejor saberlo antes que después.
Y la regla obvia: úsalo en webs que tú puedes scrapear (las tuyas, APIs públicas, datos abiertos). Respeta los términos de cada sitio.
La regla de oro
Si Claude Code te escribe scrapers que se comen un 403, no es que escriba mal — es que la librería que usa por defecto no sabe pasar Cloudflare. Cambia la herramienta, no el prompt.
Repo oficial → github.com/D4Vinci/Scrapling
Sígueme para más trucos con Claude Code e IA → @pabloinpublic
Waitlist de la comunidad → pabloinpublic.com
Comunidad PabloInPublic
Todo lo que necesitas para lanzar tu proyecto en público con IA, conocer gente que está en la misma, y no rendirte por el camino.
Waitlist abierta
- Acceso completo a mis directos y tutoriales
- Plantillas de CLAUDE.md y prompts que uso a diario
- Revisiones semanales de tu código y tu contenido
- Canal privado para dudas y feedback
- Todos los recursos que voy publicando, en un solo sitio
o sígueme en Instagram → @pabloinpublic