WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
No Result
View All Result

Cómo bloquear Scrapy y otros bots de scraping en OpenLiteSpeed, Apache y Nginx (aceptando Googlebot real)

Editor WPDirecto by Editor WPDirecto
13 junio 2025
in Optimización, Noticias
Reading Time: 2 mins read
2

El scraping masivo puede poner en jaque el rendimiento y la seguridad de tu servidor web. Herramientas automatizadas como Scrapy, curl, o python-requests suelen utilizarse para recolectar contenido de forma no autorizada.


✅ Para OpenLiteSpeed y Apache: .htaccess avanzado

# Recomendaciones para bloquear bots que saturan tu web
# Cortesía de https://wpdirecto.com y https://administraciondesistemas.com

RewriteEngine On

# Bloquear agentes de scraping conocidos
RewriteCond %{HTTP_USER_AGENT} (scrapy|python-requests|curl|wget|libwww|httpunit|nutch) [NC]
RewriteRule ^.* - [F,L]

Lenguaje del código: Apache (apache)

📌 Importante: asegúrate de tener habilitado el uso de .htaccess y reinicia el servicio tras aplicar cambios.


✅ Para Nginx: configuración segura en nginx.conf

server {
    ...

    # Bloquea agentes de scraping
    if ($http_user_agent ~* (scrapy|python-requests|curl|wget|libwww|httpunit|nutch)) {
        return 403;
    }

    ...
}
Lenguaje del código: PHP (php)

🧪 Verifica el bloqueo

Ejecuta:

curl -A "Scrapy/2.9.0 (+https://scrapy.org)" -I https://wpdirecto.com
Lenguaje del código: JavaScript (javascript)

Y deberías obtener:

Artículos relacionados

Cómo solucionar el error Internal Server Error en WordPress

6 abril 2019

FlyingPress: el plugin que lidera la optimización de WordPress con mejores resultados en Core Web Vitals

6 abril 2025

Cómo eliminar la etiqueta hreflang en URLs con la meta tag noindex en WordPress

4 mayo 2025

El frustrante error HTTP de WordPress: Por qué ocurre y cómo solucionarlo en 2025

26 junio 2025
HTTP/1.1 403 Forbidden
Lenguaje del código: HTTP (http)

🧩 Recomendaciones extra

  • ModSecurity (Apache/OpenLiteSpeed): Reglas automatizadas contra bots.
  • Cloudflare WAF: Puedes implementar bloqueos de User-Agent desde la capa CDN.
  • Iptables: Para reglas a nivel de red si los intentos persisten.
  • Logs de acceso: Revisa IPs, patrones y nuevos User-Agents para ampliar protección.
Tags: botsscrapy
ShareTweetSendSharePin
Editor WPDirecto

Editor WPDirecto

Editor de WPDirecto potenciado con IA con el apoyo del equipo de edición.

Te puede interesar...

Noticias

Cómo arreglar el error 504 Gateway Timeout en WordPress (11 soluciones probadas)

15 octubre 2025

El 504 Gateway Timeout es uno de esos errores que duelen porque no suele...

Noticias

Hackers explotan webs WordPress para impulsar campañas “ClickFix” de nueva generación: inyecciones JS, suplantaciones de Cloudflare y un giro inquietante con “cache smuggling”

9 octubre 2025

Investigadores de Sucuri, Palo Alto Networks Unit 42 y Expel han destapado una oleada...

Optimización

WebP vs AVIF en 2025: qué formato elegir, cuándo y por qué (con ejemplos reales y guías de implementación)

22 septiembre 2025

Resumen ejecutivo: en 2025, AVIF ofrece mejor compresión y calidad visual que WebP en...

Plugins

WPO Tweaks 2.1: el “todo en uno” gratuito que acelera WordPress con un clic

19 septiembre 2025

WPO Tweaks acaba de dar un salto importante con su versión 2.1.x y se...

Comments 2

  1. Angel says:
    5 meses ago

    Ese código lo que hace tambien, es bloquear las respuestas de los pedidos de redsys.

    Lo habia aplicado en 3 ecommerce y lo he tenido que modificar, por esta linea requests|curl|wget|libwww|httpunit|nutch|java) [NC]

    Bloque con 403.

    Un saludo.

    • Editor WPDirecto says:
      5 meses ago

      Gracias por el apunte Ángel, hemos quitado en el ejemplo la referencia a Java para evitar ese problema para futuros usuarios que lo copien.

No Result
View All Result
Plugin Imagify, optimizar imágenes
wordpress hosting NVME
Elegant Themes WordPress
elementor editor plugin




Últimos artículos

La vulnerabilidad de la WordPress REST API ha hecho caer a miles de sitios web

10 febrero 2017

Las mejores plantillas de WordPress para un estudio de tatuajes

30 mayo 2017

4 plugins de WordPress para crear una landing page

26 marzo 2016

Nuevo plugin de WordPress evita la pérdida accidental de menús con copias de seguridad automáticas

11 agosto 2025

Cómo acelerar la carga de imágenes en WordPress: 8 tácticas clave

18 diciembre 2024
WordPress Directo

WPDirecto.com es una revista especializada en WordPress y WooCommerce que ofrece una amplia gama de recursos, incluyendo tutoriales, análisis de plugins y plantillas, consejos de optimización y estrategias de SEO, para ayudar a los usuarios a mejorar y personalizar sus sitios web, manteniéndolos informados sobre las últimas novedades y tendencias en el mundo de WordPress.

Menu

  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

Información

WPDirecto es un medio de Medios y Redes:
  • Artículos patrocinados
  • Servicio de diseño web
  • Contacto
  • Acerca de MyR
  • Política de privacidad y cookies
  • Aviso Legal

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.

No Result
View All Result
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.