Hace unas semanas, Twitter (perdón, X) se incendió con un nuevo archivo milagroso: llms.txt. La promesa? Controlar lo que ChatGPT, Claude o Perplexity aspiran de tu sitio web. La realidad? Un poco menos gloriosa.
Te explicamos por qué no deberías apostarlo todo a esto, y qué funciona de verdad hoy.
llms.txt, la idea que parecía buena
El concepto nació en septiembre de 2024 impulsado por Answer.AI. La idea: crear un archivo de texto estandarizado en la raíz de tu sitio para guiar a los LLM en la comprensión de tu contenido. Un poco como un cartel de «bienvenido, esto es lo que importa aquí» a la entrada de tu casa digital.
Salvo que nadie está obligado a leer el cartel.
El problema que nadie dice en voz alta
El robots.txt funciona porque se basa en una convención web aceptada por todos los actores desde los años 90. Google lo respeta. Bing también. Está grabado en la cultura del crawl.
¿Para llms.txt? Cero estándar oficial del W3C. Cero obligación técnica. Cero consenso entre OpenAI, Anthropic, Google DeepMind o Mistral. Cada uno indexa la web a su manera, con sus propias reglas, sus propios bots, su propia lógica.
En la práctica: ChatGPT no lee tu llms.txt. Claude tampoco. ¿Perplexity? Lo mismo. Este archivo no aparece en ninguna de sus documentaciones oficiales como una señal reconocida.
robots.txt vs llms.txt: el partido está decidido
Esto es lo que realmente marca la diferencia hoy. Los grandes modelos tienen cada uno su propio bot de crawl oficial, y esos bots sí respetan el buen viejo robots.txt:
- GPTBot (OpenAI): documentado, bloqueable via robots.txt
- ClaudeBot (Anthropic): igual, respeta las directivas clásicas
- PerplexityBot: misma lógica
- Google-Extended: el bot de Google para sus modelos Gemini
¿Quieres controlar lo que la IA lee en tu sitio? Trabaja tu estrategia SEO y actualiza tu robots.txt. Consejo menos emocionante, pero el único que tiene un efecto real.
¿Entonces olvidamos llms.txt por completo?
No del todo. Algunas herramientas de monitorización y plugins de WordPress empiezan a leerlo. Y si el archivo se convierte en estándar en 2 o 3 años, los early adopters llevarán ventaja. Pero hoy, en 2025, apostar por llms.txt para tu SEO de IA es como optimizar tu sitio para un buscador que todavía no existe.
El verdadero reto de 2025 es ser citado por los LLM, no controlarlos. Aparecer en una respuesta de Perplexity o ChatGPT es el nuevo primer resultado de Google. Y para eso, la receta no cambia: contenido de calidad, autoridad de dominio, estructura técnica limpia.
Sin archivo mágico. Solo buen trabajo.
Fuentes: llmstxt.org, Documentación GPTBot OpenAI, Documentación ClaudeBot Anthropic