Один файл — весь сайт.
llms-full.txt — это полный дамп документации в одном Markdown‑файле. Языковая модель получает весь контекст сразу, без похода по ссылкам.
Два файла — две задачи
Оба формата дополняют друг друга. llms.txt — карта сайта для быстрой навигации. llms-full.txt — весь текст для моделей с длинным контекстом.
Лёгкая карта
Структурированный список Markdown‑страниц с краткими описаниями. Агент выбирает нужную страницу и подгружает её отдельно.
- Быстро парсится и мало токенов
- Работает с моделями любого размера
- Хорош для навигации и поиска
- Строгая структура — H1, blockquote, H2, списки
Полный дамп
Вся документация склеена в один Markdown. Одна загрузка — и у модели весь контекст продукта без дополнительных запросов.
- Не нужен агент с tool calling
- Работает offline — просто copy & paste
- Удобно для моделей и агентов с длинным контекстом
- Нет навигации — только сплошной текст
4 сценария для llms-full.txt
Пользователь кидает URL вашего llms-full.txt в чат — и получает эксперта по вашему продукту без RAG, векторов и инфраструктуры.
AI‑редакторы подгружают файл как контекст проекта. Автодополнение и рефакторинг начинают понимать ваше API без дообучения.
Один чистый Markdown — готовый датасет для обучения. Не нужно скрейпить сайт и чистить HTML от навигации и рекламы.
Сохранил файл локально — можно работать в самолёте, в изолированной сети, на воздушном зазоре. Весь продукт — в одном .md.
Крупные компании с llms-full.txt
Прямые ссылки на продакшн‑файлы. Жёлтая обводка — это llms-full.txt, серая — обычный llms.txt. Все ссылки открывают настоящие файлы.
Как сделать свой llms-full.txt
Три подхода — от ручного до полностью автоматического. Выберите, что подходит вашей команде.
Если у вас Docusaurus, VitePress, MkDocs — просто склейте все исходные .md в один файл.
cat docs/**/*.md > public/llms-full.txt
Mintlify, Fern, ReadMe и Docusaurus 3 уже умеют собирать llms-full.txt автоматически при билде.
# mintlify.json
{ "llmsTxt": { "full": true } }
Если документация — это живые HTML‑страницы, используйте firecrawl или readability для превращения в чистый Markdown.
npx firecrawl crawl \
https://your-site.ru/docs \
--output llms-full.txt \
--format markdown
О чём стоит подумать
Файл на 11MB — это миллионы токенов. Если пользователь кладёт всё в контекст — платит он или провайдер. Думайте о балансе детализации.
Модели с коротким контекстом (GPT‑3.5, локальные LLM) не прочтут большой файл. Всегда публикуйте llms.txt тоже — как запасной вариант.
Мегабайтный статический файл нужно отдавать с CDN и корректным Cache-Control. Иначе каждая загрузка агентом будет бить по серверу.
Готовы добавить llms-full.txt?
Начните с обычного llms.txt в нашем генераторе — и расширяйте дальше.