User-agent
Указывает, для какого бота правило. * — для всех. Yandex, Yandexbot — для Яндекса. Googlebot — для Google. Можно задать разные правила разным ботам.
Создайте корректный robots.txt для своего сайта: для WordPress, Bitrix, OpenCart, Tilda, интернет-магазина или лендинга. С Sitemap и Clean-param.
User-agent: * Disallow:
https://ваш-домен/robots.txt.Host устарела — Яндекс убрал её ещё в 2018 году, теперь зеркала склеиваются через 301-редирект и канонические URL. Этот генератор её намеренно не добавляет.Crawl-delay Яндекс игнорирует с 2018 года, Google никогда не поддерживал. Скорость обхода настраивайте в Вебмастере.Clean-param работает только в Яндексе — кладите его в блок User-agent: Yandex. Для Google закрывайте параметры через Disallow: /*?utm_* или канонические URL.Disallow бессмысленноrobots.txt запрещает краулинг, но не индексирование: страница может попасть в выдачу через ссылку с другого сайта (без сниппета, в виде «Описание для этого результата недоступно»). Чтобы убрать страницу из индекса, добавьте мета-тег <meta name="robots" content="noindex"> или HTTP-заголовок X-Robots-Tag: noindex.
Robots.txt — это первый файл, который запрашивает любой бот, заходя на сайт. От его корректности зависит, какие страницы попадут в индекс, какие — нет, и не утечёт ли в выдачу админка с паролями. Самая частая беда — наследование чужих шаблонов: люди копируют robots.txt от другой CMS или с устаревшего блога, и сайт начинает терять трафик. Этот генератор собирает корректный robots.txt под вашу CMS (WordPress, Bitrix, OpenCart, Tilda, Modx) с учётом её типичных служебных URL, корректно подключает Sitemap, добавляет директиву Clean-param для исключения дублей по UTM-меткам.
Что именно проверяет/считает/генерирует и как это интерпретировать.
Указывает, для какого бота правило. * — для всех. Yandex, Yandexbot — для Яндекса. Googlebot — для Google. Можно задать разные правила разным ботам.
Запрещает индексацию URL по маске. /admin/ — закрывает всю папку, *.pdf — все PDF на сайте. Регистр имеет значение.
Разрешает в исключение из Disallow. Полезно, когда папка закрыта целиком, но нужен один публичный файл внутри.
Полный URL до карты сайта (с https://, доменом). Указывайте всегда, даже если карта подана через Search Console — это страховка.
Указывает Яндексу игнорировать перечисленные параметры URL при индексации. Закрывает проблему дублей по UTM, sort, page, ref.
Вещи, которые ломают результат, даже если инструмент использован «вроде правильно».
Что работает в 2026 году и не написано в стандартных мануалах.
Только в корне сайта: site.ru/robots.txt. Файл по адресу site.ru/folder/robots.txt роботы игнорируют. Кодировка — UTF-8 без BOM.
Robots.txt запрещает скан страницы, meta robots noindex — индексацию. Если вы хотите гарантированно убрать страницу из выдачи, используйте noindex (страница должна быть открыта для скана). Robots.txt — для управления краулинг-бюджетом.
Нет, если у вас адаптивный сайт (один URL для всех устройств). Если же мобильная версия живёт на m.site.ru — там тоже нужен свой robots.txt.
Нет, с 2018 года директива Host устарела. Главное зеркало указывайте через 301-редирект или в Я.Вебмастере (Инструменты → Главное зеркало).
Откройте site.ru/robots.txt в браузере — должен показаться текст файла. Затем загрузите его в Я.Вебмастер (Анализ robots.txt) — там можно проверить любой URL вашего сайта на разрешённость к скану.
Бесплатных инструментов не хватает? Запишитесь на консультацию или закажите аудит сайта.