|

Crea un Plugin Gratuito para Crawlers de IA

Si querés que ChatGPT, Claude o Perplexity mencionen tu sitio cuando alguien haga una pregunta relacionada con tu contenido, necesitás que sus crawlers te encuentren y entiendan qué ofrecés. El plugin para crawlers de IA más directo disponible hoy en WordPress es IA SEO Generator, que genera automáticamente los cinco archivos que los bots de inteligencia artificial usan para mapear tu sitio, sin configuración manual.

En 30 segundos

  • Los crawlers de ChatGPT, Claude y Perplexity usan archivos como llms.txt y robots.txt para decidir qué contenido indexar y recomendar.
  • El plugin gratuito IA SEO Generator genera automáticamente 5 archivos de señales para bots de IA desde el panel de WordPress.
  • Un llms.txt mal configurado o ausente es una de las razones más comunes por las que sitios bien posicionados en Google no aparecen en respuestas de IA.
  • Herramientas como CrawlerCheck permiten verificar si ChatGPT, Claude y Perplexity ya están accediendo a tu sitio.
  • Configurar estos archivos no reemplaza el SEO tradicional, pero sí es el paso que la mayoría de los sitios WordPress todavía no dio.

¿Por qué importa que los crawlers de IA indexen tu sitio?

Pongamos la situación en concreto: alguien le pregunta a ChatGPT “¿cuál es el mejor plugin de caché para WordPress en 2026?” y tu sitio tiene tres artículos detallados sobre ese tema. Si el crawler de OpenAI nunca pasó por ahí, no existís para esa respuesta.

El problema es que los bots de IA no funcionan exactamente como Googlebot. ChatGPT usa Bing como infraestructura de búsqueda en tiempo real, pero también tiene su propio crawler, GPTBot, que indexa contenido de forma independiente. Perplexity tiene PerplexityBot. Claude de Anthropic tiene ClaudeBot (aunque por ahora opera más sobre lo que ya tiene Bing). Cada uno tiene sus reglas sobre qué puede leer y qué no.

Y acá viene el dato que mucha gente ignora: si tu robots.txt fue generado hace dos o tres años por un plugin de SEO que no contemplaba estos agentes, muy probablemente los estés bloqueando sin querer. Complementá con implementa el SEO multiidioma correctamente.

¿Qué es llms.txt y cómo funciona?

llms.txt es un archivo de texto plano que se ubica en la raíz de tu sitio (/llms.txt) y le indica a los modelos de lenguaje grandes cómo interpretar y navegar tu contenido. Pensalo como el robots.txt pero con un nivel de semántica mucho mayor: no solo dice “podés pasar” o “no podés pasar”, sino que explica qué tipo de sitio sos, qué secciones tienen más valor y qué datos de contacto o licencia aplican.

La propuesta surgió como estándar informal en 2024 y tomó tracción en 2026 cuando varias plataformas de IA empezaron a documentar soporte explícito. Un llms.txt básico tiene esta estructura:

# MiSitio.com
> Descripción breve del sitio y su propósito principal

## Docs
- [Guía de inicio](/guia): Descripción de la sección

## Contacto
- contact: [email protected]

## Crawlers permitidos
- allowed: GPTBot, PerplexityBot, ClaudeBot

La diferencia con humans.txt (que es básicamente un crédito del equipo) es que llms.txt está pensado para que una IA lo procese y use ese contexto para responder mejor sobre tu sitio. ¿Alguien verificó de forma independiente que todos los modelos lo usan? Todavía no hay un estándar oficial, pero los plugins más serios lo implementan como buena práctica y la adopción va creciendo.

Principales plugins gratuitos para gestionar crawlers de IA

Hay tres opciones que vale la pena conocer, cada una con un enfoque diferente.

IA SEO Generator — el más completo

Disponible en el repositorio oficial de WordPress, este plugin genera automáticamente cinco archivos al activarlo: llms.txt, llms-full.txt, ai-plugin.json, openapi.json y las señales en robots.txt. No requiere configuración para empezar a funcionar.

El archivo llms-full.txt es el más interesante: incluye el contenido completo de tus posts principales en formato simplificado, listo para que un LLM lo ingiera sin necesidad de hacer crawl página por página. Para sitios con mucho contenido técnico, esto puede marcar diferencia real. Te puede servir nuestra cobertura de desde tu hosting hasta la configuración del dominio.

Compatible con Rank Math y SEOPress, lo que es importante porque no pisa las configuraciones existentes de SEO. El código es abierto y sin tracking.

AI Content Signals — para control granular

Disponible en wpdirecto.com, este plugin apunta a quienes quieren control fino sobre qué bots entran y a qué. Permite configurar permisos separados por agente: podés dejar pasar GPTBot pero bloquear otros, o definir secciones específicas del sitio que no querés que los LLMs indexen.

Útil si tenés contenido de pago o material que preferís que no termine en respuestas de IA sin atribución. El contra es que requiere más tiempo de configuración inicial.

LLM Bot Tracker by Hueston — analytics primero

El enfoque de este plugin es diferente: en vez de optimizar la visibilidad, primero te muestra qué bots de IA ya están visitando tu sitio, con qué frecuencia y qué páginas leen. Es el punto de partida para entender si tenés un problema de visibilidad o si en realidad ya estás siendo indexado y el tema es otro.

Para sitios que nunca auditaron sus logs de acceso, esto puede ser revelador (en el buen sentido y en el malo).

PluginFunción principalGenera llms.txtAnalytics de botsCompatible con Rank MathGratis
IA SEO GeneratorGenera 5 archivos de señales AISí (+ llms-full.txt)No
AI Content SignalsControl granular en robots.txtParcialNo
LLM Bot TrackerMonitoreo de crawlers IANoN/A
plugin para crawlers de ia diagrama explicativo

Cómo configurar robots.txt para permitir crawlers de IA

Antes de instalar cualquier plugin, verificá que tu robots.txt actual no esté bloqueando los agentes principales. Entrá a tusitio.com/robots.txt y buscá líneas con Disallow bajo alguno de estos User-agents: Para más detalles técnicos, mirá especialmente en plataformas fintech.

  • GPTBot (OpenAI / ChatGPT)
  • PerplexityBot (Perplexity)
  • ClaudeBot (Anthropic)
  • Google-Extended (Google para entrenar modelos, separado del Googlebot de búsqueda)
  • CCBot (Common Crawl, base de datos que usan muchos modelos)

Si ves algo como esto, estás bloqueando esos crawlers:

User-agent: GPTBot
Disallow: /

Para permitirlos, la sintaxis correcta es:

User-agent: GPTBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: ClaudeBot
Allow: /

Sitemap: https://tusitio.com/sitemap.xml

Eso sí: si usás un plugin de SEO como Rank Math o Yoast, el robots.txt se genera dinámicamente. Necesitás agregar esas reglas desde el panel del plugin, no editando el archivo directamente, porque cualquier regeneración las va a pisar.

Alternativa: crear tu llms.txt manualmente sin plugin

Si no querés agregar otro plugin, podés crear el archivo directamente. Va en la raíz del servidor (/public_html/llms.txt o equivalente), accesible en tusitio.com/llms.txt.

Los campos más relevantes para 2026 son: una descripción del sitio en dos oraciones, los creators con datos de contacto, la política de uso (si el contenido puede usarse para entrenamiento o solo para respuestas), y la lista explícita de crawlers permitidos. Para validar la sintaxis antes de subir el archivo, el sitio amivisibleonai.com tiene un checker gratuito que también evalúa qué tan visible es tu sitio para los modelos principales.

Para quienes alojan en donweb.com, el acceso por FTP o el administrador de archivos del panel de control es suficiente para crear y subir el archivo en menos de cinco minutos.

Cómo monitorear si tu sitio es indexado por IA

Una vez que configuraste todo, el siguiente paso es verificar que funciona.

CrawlerCheck ofrece un test gratuito que simula cómo acceden ChatGPT, Claude y Perplexity a una URL de tu sitio. Te dice si el bot puede acceder, si el contenido se procesa correctamente y si hay redirecciones o bloqueos intermedios que rompen el flujo.

Para monitoreo continuo, los logs de acceso son la fuente más confiable. Si tenés acceso a los logs del servidor, buscá estas strings: GPTBot, PerplexityBot/1.0, anthropic-ai. Si aparecen con frecuencia y acceden a páginas distintas, estás siendo indexado activamente. Si nunca aparecen o solo visitan la home, hay algo que los está frenando.

Google Search Console no reporta crawlers de IA de terceros, así que para ese ángulo específico los logs son la única fuente directa. Esto se conecta con lo que analizamos en si recién empiezas en SEO.

Errores comunes al configurar visibilidad para IA

Confundir Google-Extended con Googlebot. Google-Extended es el agente que Google usa para entrenar sus modelos de IA (Gemini, SGE). Bloquear Google-Extended no afecta tu ranking en búsqueda, pero sí reduce tu aparición en respuestas de AI Overviews. Mucha gente los bloquea pensando que es Googlebot.

Subir llms.txt como HTML en vez de texto plano. Si generás el archivo con WordPress y tiene cabeceras HTML, encoding de caracteres especiales o redireccionas la URL, los crawlers lo descartan. El archivo tiene que servirse como text/plain sin ningún wrapper.

Creer que con esto ya aparecés en ChatGPT. Que el crawler de OpenAI lea tu sitio no garantiza que aparezcas en respuestas. El crawler indexa; si tu contenido es relevante y autorizado, eventualmente aparece. Pero si tu contenido es genérico o tiene baja autoridad de dominio, la visibilidad para IA tampoco va a ser alta. El llms.txt despeja obstáculos técnicos, no compensa problemas de contenido.

Esto se conecta con I built a [FREE] plugin to help my sites get picked up by AI, donde cubrimos el tema en detalle.

Preguntas Frecuentes

¿Cómo permitir que ChatGPT y Claude indexen mi sitio WordPress?

Verificá que GPTBot, PerplexityBot y ClaudeBot estén permitidos en tu robots.txt. Luego creá un archivo llms.txt en la raíz del sitio con la descripción, datos de contacto y política de uso. Los plugins como IA SEO Generator hacen este proceso automáticamente desde el panel de WordPress.

¿Qué es llms.txt y para qué sirve?

llms.txt es un archivo de texto plano en la raíz del sitio que describe su contenido, estructura y políticas de acceso a los modelos de lenguaje grandes. Funciona como una guía semántica para que los bots de IA entiendan de qué trata el sitio sin necesidad de crawlear cada página. Es un estándar emergente con adopción creciente en 2026, compatible con los principales modelos de IA.

¿Por qué mi sitio no aparece en las respuestas de ChatGPT si estoy bien rankeado en Google?

Google y ChatGPT usan infraestructuras distintas. Podés estar en la primera posición de Google y tener GPTBot bloqueado en tu robots.txt (muchos plugins de seguridad o caché los bloquean por defecto). También puede ser que ChatGPT tenga tu contenido pero no lo considere suficientemente autoritativo para esa consulta. El primer paso es verificar en los logs del servidor si GPTBot efectivamente visitó tu sitio.

¿Hay algún plugin para bloquear los crawlers de IA en vez de permitirlos?

Sí. Block AI Crawlers en el repositorio de WordPress permite bloquear selectivamente bots de IA específicos. Es útil si tenés contenido de pago o propietario que no querés que los modelos usen. La elección depende de si te interesa aparecer en respuestas de IA o preferís proteger el contenido del uso para entrenamiento.

¿Cuánto tiempo tarda en verse el resultado después de configurar llms.txt?

No hay un SLA público de ninguna plataforma. En la práctica, GPTBot suele revisitar sitios activos cada pocos días. Perplexity puede tardar más. Lo que sí podés verificar inmediatamente es que el crawler puede acceder al archivo usando CrawlerCheck. Los cambios en visibilidad en respuestas de IA pueden tardar semanas.

Conclusión

La visibilidad en motores de búsqueda tradicionales y la visibilidad en respuestas de IA son dos cosas distintas con configuraciones distintas. En 2026, un sitio WordPress bien optimizado para Google puede estar completamente invisible para ChatGPT, Claude o Perplexity, no por falta de contenido sino por configuraciones de robots.txt que nunca contemplaron estos agentes.

El costo de arreglarlo es bajo: un plugin gratuito o diez minutos editando archivos manualmente. El costo de no hacerlo es perder tráfico referido desde plataformas que ya concentran millones de consultas diarias y van a seguir creciendo. Instalá IA SEO Generator, verificá que tus crawlers clave estén habilitados, y usá CrawlerCheck para confirmar que el acceso funciona. Con eso ya estás en el grupo que hizo la tarea.

Fuentes

Similar Posts