Fichiers llms.txt inutiles pour les intelligences artificielles (IA)

Les fichiers llms.txt à la racine des sites devraient optimiser le référencement pour intelligences artificielles (IA) les moteurs de recherche. Il en est question de plus en plus souvent, mais les «analyses» consistent fréquemment à répéter les mêmes «arguments» en boucle.

En version courte

Il ne vaut pas la peine d’investir du temps (aujourd’hui) pour un tel fichier.

Pour lire un contenu sérieux sur le sujet, consultez la page Le fichier LLMS.txt par Olivier Duffez!

Pour imaginer ce que peut être le bullshit sur le même sujet, il peut être intéressant de perdre quelques minutes avec la vidéo Llms.txt: Le tuto COMPLET pour utiliser le fichier llms.txt (2025).

Ce qui suit est destiné à celles et ceux qui cherchent quelques arguments sur le sujet, pour éviter les investissements inutiles (en temps et en argent).

llms.txt n’est pas une norme ou un standard

Il n’est pas rare de lire que llms.txt est une nouvelle norme ou un nouveau standard. C’est simplement faux. C’est seulement une proposition pour une (éventuelle) standardisation.

Investir du temps pour quelque chose qui pourrait changer complètement n’est pas une bonne idée. Pour devenir un standard, il faut des arguments, du débat, un consensus. Autant dire que c’est très mal parti pour le moment.

En 2025, llms.txt n’a aucune utilité. Mieux vaut investir votre énergie ailleurs. Il est urgent d’attendre. Avec le temps, vous constaterez que ce «standard» mourra dans l’œuf. Voici pourquoi.

Le Markdown n’apporte rien

J’adore écrire en Markdown. Tous les contenus de ce site sont écrits en Markdown. C’est un excellent langage de balisage léger. Il est excellent parce qu’il est simple à utiliser pour des êtres humains.

Mais, dans le cas des grands modèles de langages (LLM), ce sont des machines qui interprètent le contenu. On a l’impression que les cerveaux derrières llms.txt l’ont oublié.

Certes, le fichier llms.txt a plutôt une bonne tête en Markdown, parce que c’est bien lisible pour les internautes. Mais les intelligences artificielles n’en ont rien à battre de l’esthétique du code source. Un fichier HTML est tout aussi simple à lire et à interpréter qu’un Markdown pour n’importe quel ordinateur.

Si un LLM veut lire ce site, qu’il utilise ce qui existe: sitemap.xml à la racine ou le plan du site disponible sur chaque page.

Un site doit être compréhensible (et une IA «intelligente»)

Si un site a besoin d’un fichier spécifique pour montrer sa structure et ses contenus, il y a un vrai problème. Dans ce cas, mieux vaut arrêter les dégâts. Mieux vaut abandonner l’optimisation du référencement (SEO). Mieux vaut investir dans l’architecture d’information (qui vaut toujours la peine).

Mais surtout, comment donner crédit à une prétendue intelligence qui serait incapable de comprendre un site. Si l’IA sur laquelle vous comptez n’est pas capable de comprendre la structure, de détecter les contenus importants et de lire de l’HTML, il faut l’abandonner sans attendre.

Le meilleure synthèse (dans le forum Hugo):

An AI that requires a specific format to consume information is not an AI.

Sous cet angle, ce truc de llms.txt est tout bonnement absurde!

Le fichier est créé, mais pas utilisé

La bonne nouvelle, c’est que ce nouveau «standard» – cette nouvelle «norme» – n’est pas utilisé. Les vendeurs de plugins essaient de vous la fourguer, pour justifier leurs version premium. Mais les IA et LLM s’en balancent.

Des entreprises expliquent comme créer un tel fichier tout en disant dans le même billet:

Utiliser llms.txt ne vaut probablement pas la peine pour le moment, sauf si vous êtes simplement curieux et souhaitez expérimenter. […]

Aucune des entreprises spécialisées dans les technologies LLM, comme OpenAI, Google ou Anthropic, n’a officiellement déclaré suivre ces fichiers lorsqu’elles explorent les sites web.

On marche sur la tête. On brasse du vent. On utilise des ressources pour créer du rien. Et agences de communication continuent de vous expliquer qu’il faut refaire votre site avec un llms.txt pour optimiser votre GEO (Generative Engine Optimization) et améliorer votre image.