llms.txt : le nouveau fichier SEO dont tout le monde parle et que personne ne lit

Il y a quelques semaines, Twitter (pardon, X) s’est embrasé autour d’un nouveau fichier miracle : llms.txt. La promesse ? Contrôler ce que ChatGPT, Claude ou Perplexity aspirent sur votre site. La réalité ? Un peu moins glorieuse.

Pourquoi vous ne devriez pas tout miser là-dessus, et ce qui fonctionne vraiment aujourd’hui.

llms.txt, l’idée qui semblait bonne

Le concept est né en septembre 2024 sous l’impulsion d’Answer.AI. L’idée : créer un fichier texte standardisé à la racine de votre site pour guider les LLM dans leur compréhension de votre contenu. Un peu comme un panneau « bienvenue, voici ce qui est important ici » à l’entrée de votre maison numérique.

Sauf que personne n’est obligé de lire le panneau.

Le problème que personne ne dit à voix haute

Le robots.txt fonctionne parce qu’il repose sur une convention web acceptée par tous les acteurs depuis les années 90. Google le respecte. Bing aussi. C’est inscrit dans la culture du crawl.

Pour llms.txt ? Zéro standard officiel du W3C. Zéro obligation technique. Zéro consensus entre OpenAI, Anthropic, Google DeepMind ou Mistral. Chacun crawle le web comme il l’entend, avec ses propres règles, ses propres bots, sa propre logique d’indexation.

Concrètement : ChatGPT ne lit pas votre llms.txt. Claude non plus. Perplexity ? Pas davantage. Ce fichier n’existe dans aucune de leurs documentations officielles comme un signal pris en compte.

robots.txt vs llms.txt : le match est vite plié

Voici ce qui change vraiment la donne aujourd’hui. Les grands modèles ont chacun leur bot de crawl officiel, et eux, respectent le bon vieux robots.txt :

  • GPTBot (OpenAI) : documenté, bloquable via robots.txt
  • ClaudeBot (Anthropic) : idem, respecte les directives classiques
  • PerplexityBot : même logique
  • Google-Extended : le bot de Google pour ses modèles Gemini

Vous voulez contrôler ce que les IA lisent sur votre site ? Travaillez votre stratégie SEO et mettez à jour votre robots.txt. C’est moins sexy comme conseil, mais c’est celui qui a un effet réel.

Alors llms.txt, on oublie complètement ?

Pas tout à fait. Quelques outils de veille et plugins WordPress commencent à le lire. Et si le fichier devient un standard dans 2 ou 3 ans, les early adopters auront une longueur d’avance. Mais aujourd’hui, en mai 2025, miser sur llms.txt pour votre SEO IA c’est comme optimiser votre site pour un moteur de recherche qui n’existe pas encore.

Le vrai enjeu de 2025, c’est d’être cité par les LLM, pas de les contrôler. Apparaître dans une réponse Perplexity ou ChatGPT, c’est le nouveau premier résultat Google. Et pour ça, la recette ne change pas : contenu de qualité, autorité de domaine, structure technique propre.

Pas de fichier magique. Juste du bon travail.

Sources : llmstxt.org, Documentation GPTBot OpenAI, Documentation ClaudeBot Anthropic