WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
No Result
View All Result

Cómo bloquear Scrapy y otros bots de scraping en OpenLiteSpeed, Apache y Nginx (aceptando Googlebot real)

Editor WPDirecto by Editor WPDirecto
13 junio 2025
in Optimización, Noticias
Reading Time: 2 mins read
2

El scraping masivo puede poner en jaque el rendimiento y la seguridad de tu servidor web. Herramientas automatizadas como Scrapy, curl, o python-requests suelen utilizarse para recolectar contenido de forma no autorizada.


✅ Para OpenLiteSpeed y Apache: .htaccess avanzado

# Recomendaciones para bloquear bots que saturan tu web
# Cortesía de https://wpdirecto.com y https://administraciondesistemas.com

RewriteEngine On

# Bloquear agentes de scraping conocidos
RewriteCond %{HTTP_USER_AGENT} (scrapy|python-requests|curl|wget|libwww|httpunit|nutch) [NC]
RewriteRule ^.* - [F,L]

Lenguaje del código: Apache (apache)

📌 Importante: asegúrate de tener habilitado el uso de .htaccess y reinicia el servicio tras aplicar cambios.


✅ Para Nginx: configuración segura en nginx.conf

server {
    ...

    # Bloquea agentes de scraping
    if ($http_user_agent ~* (scrapy|python-requests|curl|wget|libwww|httpunit|nutch)) {
        return 403;
    }

    ...
}
Lenguaje del código: PHP (php)

🧪 Verifica el bloqueo

Ejecuta:

curl -A "Scrapy/2.9.0 (+https://scrapy.org)" -I https://wpdirecto.com
Lenguaje del código: JavaScript (javascript)

Y deberías obtener:

Artículos relacionados

Cómo editar ficheros de WordPress mediante un cliente FTP

19 septiembre 2017

Strict Transport: Implementación del fichero .htaccess para una mayor protección

18 diciembre 2024

Cómo reemplazar textos en un WordPress

27 octubre 2015

Blindaje digital para WordPress: nuevas plantillas seguras y plugin anti-fingerprint creados por @aitorroma

22 abril 2025
HTTP/1.1 403 Forbidden
Lenguaje del código: HTTP (http)

🧩 Recomendaciones extra

  • ModSecurity (Apache/OpenLiteSpeed): Reglas automatizadas contra bots.
  • Cloudflare WAF: Puedes implementar bloqueos de User-Agent desde la capa CDN.
  • Iptables: Para reglas a nivel de red si los intentos persisten.
  • Logs de acceso: Revisa IPs, patrones y nuevos User-Agents para ampliar protección.
Tags: botsscrapy
ShareTweetSendSharePin
Editor WPDirecto

Editor WPDirecto

Editor de WPDirecto potenciado con IA con el apoyo del equipo de edición.

Te puede interesar...

Optimización

Cómo reducir los fallos de caché en WordPress y evitarlos: consejos prácticos con LiteSpeed, Redis y MySQL

2 septiembre 2025

En el ecosistema de WordPress, la velocidad de carga y la eficiencia en la...

Noticias

DeepSeek V3.1 y WooCommerce: cómo la IA híbrida puede transformar tu tienda online

2 septiembre 2025

El comercio electrónico se ha convertido en un terreno de alta competencia donde la...

Noticias

Cómo la IA está transformando la seguridad de WordPress en entornos cloud

1 septiembre 2025

Ejecutar WordPress en la nube es un sueño para desarrolladores y empresas: rápido, escalable...

Optimización

Cómo instalar y usar MySQLTuner en Ubuntu para optimizar MySQL o MariaDB

29 agosto 2025

Optimizar el rendimiento de una base de datos es tan importante como contar con...

Comments 2

  1. Angel says:
    3 meses ago

    Ese código lo que hace tambien, es bloquear las respuestas de los pedidos de redsys.

    Lo habia aplicado en 3 ecommerce y lo he tenido que modificar, por esta linea requests|curl|wget|libwww|httpunit|nutch|java) [NC]

    Bloque con 403.

    Un saludo.

    • Editor WPDirecto says:
      3 meses ago

      Gracias por el apunte Ángel, hemos quitado en el ejemplo la referencia a Java para evitar ese problema para futuros usuarios que lo copien.

No Result
View All Result
Plugin Imagify, optimizar imágenes
wordpress hosting NVME
Elegant Themes WordPress
elementor editor plugin




Últimos artículos

Como mostrar los últimos tweets en tu WordPress sin plugins

10 febrero 2012

FlyingPress: el plugin que lidera la optimización de WordPress con mejores resultados en Core Web Vitals

6 abril 2025

Cinco formas de acelerar el panel de administración de WordPress y mejorar su rendimiento

28 marzo 2025

Cómo solucionar el problema de pantalla en blanco en WordPress

10 abril 2025

Cómo agregar un mapa de España interactivo en WordPress

24 abril 2019
WordPress Directo

WPDirecto.com es una revista especializada en WordPress y WooCommerce que ofrece una amplia gama de recursos, incluyendo tutoriales, análisis de plugins y plantillas, consejos de optimización y estrategias de SEO, para ayudar a los usuarios a mejorar y personalizar sus sitios web, manteniéndolos informados sobre las últimas novedades y tendencias en el mundo de WordPress.

Menu

  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

Información

WPDirecto es un medio de Medios y Redes:
  • Artículos patrocinados
  • Servicio de diseño web
  • Contacto
  • Acerca de MyR
  • Política de privacidad y cookies
  • Aviso Legal

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.

No Result
View All Result
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.