Recursos

Scrapling Stealth: scrapea webs con Cloudflare desde Claude Code

Una librería Python que se salta Cloudflare Turnstile y va ~784x más rápida que BeautifulSoup. Con el snippet listo para enchufar a Claude Code.

  • #claude-code
  • #python
  • #scraping
  • #cloudflare

Le pides a Claude Code que scrapee una web y Cloudflare le corta el paso. Scrapling es una librería Python (43.5k stars, BSD-3-Clause) que resuelve Turnstile/Interstitial automáticamente y, según el benchmark del propio repo (5000 elementos anidados), va ~784x más rápida que BeautifulSoup+Lxml.

Instalación

Dos comandos. El primero instala los fetchers, el segundo descarga los binarios de navegador que usa el modo stealth.

pip install "scrapling[fetchers]"
scrapling install

Snippet base

Cinco líneas. Importas StealthyFetcher, le pasas la URL con solve_cloudflare=True y parseas el resultado con selectores CSS.

from scrapling.fetchers import StealthyFetcher

page = StealthyFetcher.fetch(
    'https://nopecha.com/demo/cloudflare',
    solve_cloudflare=True,
    headless=True,
)
data = page.css('#padded_content a').getall()

StealthyFetcher es el módulo que hace la petición saltándose la protección anti-bot. solve_cloudflare=True resuelve el challenge (Turnstile/Interstitial) automáticamente antes de devolverte el HTML.

Cómo enchufarlo a Claude Code

El truco: dejar el snippet en un archivo .py dentro del proyecto y referenciarlo en tu CLAUDE.md como herramienta disponible para scraping. Así cuando le pidas a Claude Code “extrae los enlaces de esta web”, en vez de tirar de requests + BeautifulSoup y comerse un 403, invoca el script con StealthyFetcher y sale a la primera.

Patrón mínimo:

  1. Guarda el snippet de arriba en scripts/scrape.py.
  2. En tu CLAUDE.md añade una línea: “Para scraping de webs con protección Cloudflare, usar scripts/scrape.py (StealthyFetcher de Scrapling).”
  3. A partir de ahí, Claude Code lo invoca cuando lo necesita.

Honestidad técnica

El bypass de Cloudflare funciona en muchos casos, pero no es magia infinita. Sitios con WAF agresivo o Turnstile en modo Managed pueden seguir bloqueando. Mejor saberlo antes que después.

Y la regla obvia: úsalo en webs que tú puedes scrapear (las tuyas, APIs públicas, datos abiertos). Respeta los términos de cada sitio.

La regla de oro

Si Claude Code te escribe scrapers que se comen un 403, no es que escriba mal — es que la librería que usa por defecto no sabe pasar Cloudflare. Cambia la herramienta, no el prompt.


Repo oficial → github.com/D4Vinci/Scrapling

Sígueme para más trucos con Claude Code e IA → @pabloinpublic

Waitlist de la comunidad → pabloinpublic.com

Comunidad PabloInPublic

Todo lo que necesitas para lanzar tu proyecto en público con IA, conocer gente que está en la misma, y no rendirte por el camino.

Waitlist abierta

  • Acceso completo a mis directos y tutoriales
  • Plantillas de CLAUDE.md y prompts que uso a diario
  • Revisiones semanales de tu código y tu contenido
  • Canal privado para dudas y feedback
  • Todos los recursos que voy publicando, en un solo sitio

Te escribo en cuanto abra la comunidad. Sin spam, prometido.

o sígueme en Instagram → @pabloinpublic