llms.txt ne sert à rien pour le SEO – Et pourtant Google l’audite
Le fichier llms.txt est censé aider les IA à lire votre site. Les données disent qu’aucun moteur de recherche ou de réponse ne le consulte. Pourtant, Google vient d’ajouter sa vérification dans Lighthouse. Cette contradiction dit l’essentiel sur ce que ce fichier fait vraiment, et sur ce qu’on essaie de vous vendre.
Ce que llms.txt fait vraiment, et ce qu’on vous vend qu’il fait
llms.txt est une proposition publiée en septembre 2024 par Jeremy Howard, cofondateur d’Answer.AI, et hébergée sur llmstxt.org. Le problème qu’il voulait résoudre n’avait rien à voir avec le référencement : les fenêtres de contexte des modèles de langage sont trop petites pour avaler un site entier en HTML, avec sa navigation, ses scripts et sa publicité. L’idée est de déposer à la racine du domaine un fichier markdown qui pointe vers les pages essentielles, dans un format propre que le modèle ingère facilement.
Première confusion à dissiper : llms.txt n’est pas un robots.txt pour IA. Il n’interdit rien, il ne bloque aucun bot. Le contrôle d’accès reste le rôle de robots.txt. llms.txt se contente d’orienter vers le contenu, il ne le protège pas. Deux variantes complètent la proposition : llms-full.txt, qui compile tout le texte du site en un seul fichier, co-créé par Mintlify avec Anthropic puis intégré au standard, et les versions markdown de pages obtenues en ajoutant .md à l’URL.
Reste une distinction que presque personne ne pose clairement, et qui structure tout le reste : les crawlers de recherche et de réponse d’un côté, les agents applicatifs de l’autre. Ces deux familles de robots ne traitent pas ce fichier de la même façon. C’est là que se joue le malentendu.
Les données qui tuent le mythe GEO
Si l’argument de vente est « mets un llms.txt pour être plus cité par ChatGPT, Perplexity ou les AI Overviews », les données contredisent frontalement la promesse.
L’étude la plus large vient de SE Ranking, sur près de 300 000 domaines : 10,13 % seulement ont un llms.txt, et surtout, aucune relation entre la présence du fichier et la fréquence de citation dans les réponses des grands modèles. L’adoption est même répartie de façon homogène entre les petits et les gros sites, ce qui signale de l’expérimentation dispersée, pas une dynamique de fond. Search Engine Journal, en relayant l’étude, note que même quand GPTBot va chercher le fichier, cela ne change rien aux citations.
Les logs confirment. OtterlyAI a mesuré, sur 90 jours, 84 requêtes vers le llms.txt sur 62 100 requêtes de bots IA, soit 0,1 %. Trois fois moins qu’une page de contenu ordinaire sur le même domaine. De son côté, Limy a observé 408 hits sur plus de 500 millions de visites de bots IA sur la même fenêtre. Trois sources indépendantes, le même verdict : les bots qui pèsent sur la visibilité IA ne regardent pas ce fichier.
Google ne laisse aucune ambiguïté. Gary Illyes a confirmé que le moteur ne supporte pas llms.txt et n’en a pas l’intention, et John Mueller l’a comparé à la balise meta keywords, ce champ que les moteurs ignorent depuis plus de dix ans parce qu’il est contrôlé par l’éditeur, donc manipulable. Quand le fichier est brièvement apparu dans la documentation développeur de Google fin 2025, c’était un effet de bord de leur CMS, pas un signe d’adoption. L’équipe Search l’a retiré de ses propres docs peu après.
Le seul endroit où il marche
Conclure que llms.txt est inutile serait pourtant faux. Il sert, mais pas là où le marché regarde.
Les agents applicatifs et les assistants de code le lisent réellement. Cursor, Claude Code, GitHub Copilot, Cline, Aider, et un nombre croissant d’intégrations MCP cherchent /llms.txt et /llms-full.txt quand on les pointe vers un site de documentation. Le mécanisme est simple : l’agent vérifie la présence du fichier, le lit pour identifier les pages pertinentes, puis va les récupérer une par une. Sans le fichier, il devine à partir de la structure d’URL ou retombe sur des données d’entraînement parfois périmées.
Le bon cas d’usage est donc éditorial et produit, pas SEO. Documentation technique, SaaS, contenu B2B susceptible d’être résumé par un agent acheteur lors d’une présélection de fournisseurs. Dans ces contextes, un llms.txt bien construit réduit les erreurs de récupération et améliore la fidélité de ce que l’agent rapporte. C’est un standard business-to-agent, pas un levier de visibilité dans les moteurs de réponse grand public. Confondre les deux, c’est se tromper de combat.
Le paradoxe Lighthouse
Et puis il y a le signal qui rend le sujet réellement intéressant. Fin mai 2026, l’équipe Chrome a ajouté à Lighthouse une catégorie expérimentale baptisée Agentic Browsing, et l’un de ses contrôles vérifie la présence d’un llms.txt à la racine du domaine.
Autrement dit, le même Google qui répète que le fichier ne sert à rien pour le classement l’inscrit comme critère dans son propre outil d’audit pour agents. La contradiction n’est qu’apparente. Elle dit que Google sépare nettement deux mondes : le search, où llms.txt n’a aucun rôle, et le web agentique, où il prépare un terrain qu’il ne veut pas encore qualifier officiellement. C’est exactement la frontière qu’on traçait plus haut, et c’est Google lui-même qui la matérialise.
Ce qu’on teste en ce moment
Sur ce genre de sujet, on n’aime pas se contenter des annonces. Le bruit est permanent, les certitudes des uns contredisent celles des autres, et la seule chose qui tranche, c’est la mesure sur des sites réels.
C’est notre façon de travailler chez Deux.io. Quand un standard émerge, on l’instrumente : protocoles stricts, KPI définis en amont, lecture dans les logs et dans les outils analytics de ce qui se passe vraiment. On ne déduit pas une décision d’un article, on la déduit d’une donnée qu’on a produite et qu’on peut défendre. C’est ce qui nous permet d’adapter nos recommandations client au signal réel plutôt qu’à la tendance du moment. llms.txt fait partie de ces sujets qu’on garde sous mesure active.
Ce qu’on recommande, et à qui
Distinguons ce qui est établi de ce qui reste un pari.
Ce qui est établi : llms.txt n’apporte aucun retour mesurable en visibilité IA ou en SEO. On ne le vendra donc jamais comme un levier de citation. Quiconque le présente comme une optimisation GEO se trompe ou vous trompe.
Notre pari, et nous l’assumons comme tel : le fichier a une vraie valeur dans un périmètre étroit, celui des sites de documentation, des SaaS et des éditeurs B2B exposés aux agents. Et même là, la règle est de coût. Si l’implémentation est un travail de trente minutes, faites-le, c’est une assurance peu chère pour le jour où les agents pèseront plus lourd. Si c’est un projet, attendez. Pour la grande majorité des sites commerciaux, le temps est mieux investi dans l’autorité de contenu et la propreté technique, les deux seuls leviers qui décident si vos pages entrent dans le réservoir de récupération des modèles.
Le seul scénario qui inverserait cette position : une adoption formelle de llms.txt par Google pour AI Mode ou les AI Overviews. Ce jour-là, tout bascule. Ce n’est pas le cas aujourd’hui, et c’est ce qu’on surveille sur les douze prochains mois.
Si vous voulez savoir si votre site relève du périmètre où llms.txt a du sens, ou plus largement construire une présence solide dans les moteurs IA sur la base de données et pas d’intuitions, c’est exactement le travail qu’on mène chez Deux.io.
Nos dernières success stories SEO
Blast.club, dirigé par Anthony Bourbon, est une plateforme permettant d'investir dans des startups via des adhésions offrant des opportunités exclusives.
En 2018, Cybertek a racheté Grosbill, une autre marque reconnue dans le domaine de l'informatique, qui avait rencontré des difficultés financières. Ce rachat a permis de relancer Grosbill, tout en conservant son magasin phare à Paris et en maintenant son site web opérationnel
Horiz.io est un SaaS spécialisé dans l’investissement locatif, permettant aux utilisateurs de calculer rapidement le rendement des biens immobiliers directement à partir des annonces en ligne. Avec plus de 300 000 utilisateurs, il propose des outils pour analyser la rentabilité locative, simuler des investissements, et gérer des biens locatifs.
Nomadia est un SaaS de mobilité pour les professionnels itinérants, offrant des outils d’optimisation de tournées et de gestion des forces de vente. Créée en 2021, elle vise à réduire les émissions de CO2 jusqu’à 30 % et à améliorer la productivité des entreprises dans plus de 90 pays
Chaque semaine, recevez les meilleurs articles growth résumés et découvrez un outil unique pour booster votre business. Profitez aussi d’outils gratuits et de webinars exclusifs.