WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting
No Result
View All Result
WordPress Directo
No Result
View All Result

Cómo bloquear Scrapy y otros bots de scraping en OpenLiteSpeed, Apache y Nginx (aceptando Googlebot real)

Editor WPDirecto by Editor WPDirecto
13 junio 2025
in Optimización, Noticias
Reading Time: 2 mins read
2

El scraping masivo puede poner en jaque el rendimiento y la seguridad de tu servidor web. Herramientas automatizadas como Scrapy, curl, o python-requests suelen utilizarse para recolectar contenido de forma no autorizada.


✅ Para OpenLiteSpeed y Apache: .htaccess avanzado

# Recomendaciones para bloquear bots que saturan tu web
# Cortesía de https://wpdirecto.com y https://administraciondesistemas.com

RewriteEngine On

# Bloquear agentes de scraping conocidos
RewriteCond %{HTTP_USER_AGENT} (scrapy|python-requests|curl|wget|libwww|httpunit|nutch) [NC]
RewriteRule ^.* - [F,L]

Lenguaje del código: Apache (apache)

📌 Importante: asegúrate de tener habilitado el uso de .htaccess y reinicia el servicio tras aplicar cambios.


✅ Para Nginx: configuración segura en nginx.conf

server {
    ...

    # Bloquea agentes de scraping
    if ($http_user_agent ~* (scrapy|python-requests|curl|wget|libwww|httpunit|nutch)) {
        return 403;
    }

    ...
}
Lenguaje del código: PHP (php)

🧪 Verifica el bloqueo

Ejecuta:

curl -A "Scrapy/2.9.0 (+https://scrapy.org)" -I https://wpdirecto.com
Lenguaje del código: JavaScript (javascript)

Y deberías obtener:

Artículos relacionados

Desmitificando los mitos del SEO en WordPress: Lo que realmente debes saber en 2025

20 febrero 2025

WordPress lanza la versión 6.5.4 para aumentar su seguridad

18 diciembre 2024

¿Qué novedades trae la nueva versión de WordPress 5.0.1?

13 diciembre 2018

Los mejores podcasts sobre WordPress

9 octubre 2019
HTTP/1.1 403 Forbidden
Lenguaje del código: HTTP (http)

🧩 Recomendaciones extra

  • ModSecurity (Apache/OpenLiteSpeed): Reglas automatizadas contra bots.
  • Cloudflare WAF: Puedes implementar bloqueos de User-Agent desde la capa CDN.
  • Iptables: Para reglas a nivel de red si los intentos persisten.
  • Logs de acceso: Revisa IPs, patrones y nuevos User-Agents para ampliar protección.
Tags: botsscrapy
ShareTweetSendSharePin
Editor WPDirecto

Editor WPDirecto

Editor de WPDirecto potenciado con IA con el apoyo del equipo de edición.

Te puede interesar...

Noticias

Guía definitiva para reparar un WordPress hackeado: del caos al control paso a paso

19 julio 2025

Cómo recuperar tu sitio web, proteger tus datos y blindar tu instalación para evitar...

Optimización

Automatización avanzada mediante plugins: seguridad, SEO y flujos de trabajo

5 julio 2025

La automatización se ha convertido en una pieza clave para gestionar sitios web eficientes...

Optimización

Migración segura de versiones importantes de PHP (ej. 7.4 a 8.4) en WordPress

1 julio 2025

Actualizar la versión de PHP en un sitio WordPress no es solo una recomendación...

Optimización

Comparativa de motores de caché y optimización de rendimiento en WordPress

30 junio 2025

El rendimiento web sigue siendo una prioridad para administradores y desarrolladores WordPress en 2025....

Comments 2

  1. Angel says:
    2 meses ago

    Ese código lo que hace tambien, es bloquear las respuestas de los pedidos de redsys.

    Lo habia aplicado en 3 ecommerce y lo he tenido que modificar, por esta linea requests|curl|wget|libwww|httpunit|nutch|java) [NC]

    Bloque con 403.

    Un saludo.

    Responder
    • Editor WPDirecto says:
      2 meses ago

      Gracias por el apunte Ángel, hemos quitado en el ejemplo la referencia a Java para evitar ese problema para futuros usuarios que lo copien.

      Responder

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

No Result
View All Result
Plugin Imagify, optimizar imágenes
wordpress hosting NVME
Elegant Themes WordPress
elementor editor plugin




Últimos artículos

Cómo añadir un icono a los links externos en WordPress

16 noviembre 2015

Atarim: Revoluciona la gestión de proyectos web en WordPress con colaboración visual en tiempo real

10 febrero 2025

Security.txt en WordPress: Un Paso Clave para la Seguridad Web

9 marzo 2025

¿Qué novedades trae la nueva versión de WordPress 4.9.4?

7 febrero 2018

Prueba la velocidad, seguridad y funcionalidad de tu sitio con WordPress

13 junio 2023
WordPress Directo

WPDirecto.com es una revista especializada en WordPress y WooCommerce que ofrece una amplia gama de recursos, incluyendo tutoriales, análisis de plugins y plantillas, consejos de optimización y estrategias de SEO, para ayudar a los usuarios a mejorar y personalizar sus sitios web, manteniéndolos informados sobre las últimas novedades y tendencias en el mundo de WordPress.

Menu

  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

Información

WPDirecto es un medio de Medios y Redes:
  • Artículos patrocinados
  • Servicio de diseño web
  • Contacto
  • Acerca de MyR
  • Política de privacidad y cookies
  • Aviso Legal

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.

No Result
View All Result
  • Tutoriales
  • Plugins
  • Plantillas
  • Optimización
  • SEO
  • WordPress Hosting

© 1995-2025 Color Vivo Internet, SLU (Medios y Redes Online).. Otros contenidos se cita fuente. Infraestructura cloud servidores dedicados de Stackscale.