Что такое llms.txt и зачем он нужен сайту

Люди всё чаще спрашивают не поисковик, а нейросеть. llms.txt — это открытый стандарт, который помогает языковым моделям правильно понимать ваш сайт. Разбираем, как он устроен и что даёт на практике.

Определение и происхождение

llms.txt — это текстовый файл в формате Markdown, который размещается в корне сайта по адресу /llms.txt и рассказывает языковым моделям, о чём сайт и какие страницы на нём главные. Название расшифровывается просто: LLMs — large language models, большие языковые модели.

Стандарт предложил в сентябре 2024 года Джереми Ховард — сооснователь Answer.AI и fast.ai, один из самых известных практиков машинного обучения. Спецификация опубликована на llmstxt.org и открыта для всех.

Идея та же, что у robots.txt в 1994 году: договориться об одном стандартном месте, где машина найдёт то, что ей нужно. Только на этот раз машина — не поисковый робот, а нейросеть.

Какую проблему решает

Когда ChatGPT, Claude или Perplexity нужно ответить на вопрос по материалам сайта, они сталкиваются с двумя ограничениями:

llms.txt решает обе проблемы: в паре килобайт чистого Markdown модель получает название проекта, его суть и аннотированный список ключевых страниц. Вместо того чтобы блуждать по сайту, она сразу идёт по нужным адресам.

Как устроен файл

Формат намеренно простой — файл легко написать вручную и легко разобрать программой. По спецификации элементы идут в строгом порядке:

  1. Заголовок H1 — название сайта или проекта. Единственный обязательный элемент.
  2. Цитата-описание (>) — одно-два предложения о сути проекта.
  3. Свободный текст — при необходимости: контекст, аудитория, важные оговорки. Без заголовков.
  4. Разделы H2 со списками ссылок — каждая ссылка в формате [название](URL): пояснение. Пояснение необязательно, но полезно.
  5. Раздел ## Optional — особый: ссылки из него модель может пропустить, если контекст ограничен.
Минимальный корректный llms.txt
# Название проекта

> Одно предложение, объясняющее, что это и для кого.

## Документация

- [Быстрый старт](https://example.ru/docs/start): установка за 5 минут
- [Справочник API](https://example.ru/docs/api)

## Optional

- [История изменений](https://example.ru/changelog)

Спецификация также рекомендует отдавать Markdown-версии самих страниц: добавьте .md к адресу страницы — например, /docs/start.md рядом с /docs/start. Так модель получает чистый текст без HTML-шума.

Отличия от robots.txt и sitemap.xml

Эти файлы часто путают, но задачи у них разные:

Критерийrobots.txtsitemap.xmlllms.txt
ЗадачаОграничить обходПеречислить всёВыделить главное
АудиторияПоисковые роботыПоисковые роботыЯзыковые модели
ФорматДирективыXMLMarkdown
Описания страницНетНетДа, с пояснениями
Читается человекомС трудомПлохоЛегко

Важно: llms.txt дополняет, а не заменяет классические файлы. robots.txt и sitemap.xml по-прежнему нужны для поисковиков — держите на сайте все три.

Кто уже использует

Стандарт быстрее всего прижился там, где точность ответа ИИ критична — в документации технологических продуктов. Живые файлы публикуют:

Ссылки на эти файлы с разбором, что у них устроено хорошо, — на странице примеров.

llms.txt и SEO: честный разбор

Вокруг llms.txt много маркетингового шума, поэтому зафиксируем факты:

Нужен ли llms.txt именно вам

Файл имеет смысл практически для любого содержательного сайта:

Создать файл можно за минуту: генератор llms.txt соберёт страницы из sitemap и сгруппирует их по разделам, а валидатор проверит результат по спецификации. Если хотите разобраться в деталях — читайте пошаговую инструкцию.