Robots.txt — опасные настройки по умолчанию для SEO

Анатолий Кузнецов

SEO-оптимизатор с 20-летним стажем. Автор блога hozyindachi.ru о продвижении и доработке сайтов.

Файл robots.txt — это 100-200 строчек текста, которые определяют, увидит ли Яндекс ваш сайт как авторитетный ресурс или как свалку мусорного контента. Большинство владельцев даже не открывают этот файл — мол, «там всё работает по умолчанию». А между тем «настройки по умолчанию» часто содержат критические ошибки, из-за которых половина сайта вылетает из индекса или, наоборот, в индекс попадает то, что там не должно быть. Сегодня раскроем все грязные секреты robots.txt, о которых молчат SEO-агентства.

Содержание статьи

1 Что такое robots.txt и зачем он нужен

2 Опасность 1: Disallow: / — классический расстрел

3 Опасность 2: Закрытие CSS и JS от индексации

4 Опасность 3: Ошибки с wildcards (звёздочками)

5 Опасность 4: Устаревшее Disallow для плагинов и тем

6 Опасность 5: Злоупотребление Clean-param

7 Опасность 6: Отсутствие sitemap.xml в robots.txt

8 Опасность 7: Слишком сложные конструкции

9 Правильный robots.txt для WordPress (шаблон)

10 Правильный robots.txt для Bitrix (шаблон)

11 Как проверить свой robots.txt

12 Проверка 1: Открыть файл в браузере

13 Проверка 2: Инструмент в Яндекс.Вебмастере

14 Проверка 3: Инструмент в Google Search Console

15 Проверка 4: Screaming Frog в режиме соблюдения robots

16 Частые вопросы по robots.txt

17 Нужно ли закрывать страницы фильтров в robots.txt?

18 Что делать со страницами корзины и личного кабинета?

19 Что делать с версией для печати?

20 Нужно ли писать директивы отдельно для Яндекса?

21 Что будет, если robots.txt вообще нет?

22 Реальный кейс «случайной катастрофы»

23 Ваш план действий сегодня

24 Увеличьте позиции и продажи вашего сайта

25 Остались вопросы по продвижению?

Что такое robots.txt и зачем он нужен

Robots.txt — это текстовый файл в корне сайта (example.ru/robots.txt), в котором вы пишете инструкции для поисковых роботов. Что сканировать, что не сканировать, где искать карту сайта. Это первый файл, который открывает поисковый робот, придя на сайт.

Логика простая: правильно настроенный robots.txt направляет бота на нужные страницы, бережёт краулинговый бюджет, улучшает индексацию ценных страниц. Неправильный — блокирует индексацию нужного или, наоборот, забивает индекс мусором.

Опасность 1: Disallow: / — классический расстрел

Самая страшная ошибка, которую я видел сотни раз. Разработчик делал сайт на тестовом домене, в robots.txt прописал:

User-agent: * Disallow: /

Эта конструкция запрещает индексацию всего сайта целиком. Сайт уехал в прод, файл забыли обновить, поисковые роботы увидели запрет — и сайт навсегда исчез из поиска.

Как обнаружить: открыть example.ru/robots.txt. Если увидите Disallow: / без дополнительных ограничений — срочно менять.

Как исправить: удалить эту строку, оставить более конкретные Disallow для служебных разделов.

Опасность 2: Закрытие CSS и JS от индексации

Устаревший совет из 2010 года: «закройте от индексации папки /css/ и /js/, чтобы не засорять индекс». В 2026 году это опасно.

Современные поисковики рендерят страницы как браузер, чтобы увидеть их «глазами пользователя». Если закрыть CSS и JS, Яндекс видит ваш сайт как голый HTML — без стилей, без функциональности. И оценивает его как плохо свёрстанный сайт из нулевых.

Правильно: открывать CSS и JS для индексации:

Allow: /wp-content/themes/*.css Allow: /wp-content/themes/*.js Allow: /wp-content/plugins/*.css Allow: /wp-content/plugins/*.js

Опасность 3: Ошибки с wildcards (звёздочками)

Символ * в robots.txt означает «любой набор символов». Неправильно применённый — убивает половину сайта.

Пример опасной конструкции:

Disallow: /*.php

Многие думают, что это «закрыть все .php файлы». На деле — блокирует все страницы с .php в URL, а это может быть половина вашего сайта на самописной CMS.

Всегда проверяйте, что именно попадает под вашу директиву через инструмент «Анализ robots.txt» в Яндекс.Вебмастере.

Опасность 4: Устаревшее Disallow для плагинов и тем

Старые шаблоны robots.txt для WordPress включали:

Disallow: /wp-content/plugins/ Disallow: /wp-content/themes/

В 2026 году это убивает правильную индексацию, потому что CSS и JS ваших тем и плагинов находятся именно там. Когда Яндекс не может их загрузить — он видит сайт «поломанным».

Правильно: закрыть только конкретные служебные папки, оставив доступ к ресурсам:

Disallow: /wp-admin/ Disallow: /wp-includes/ Disallow: /*/feed/ Allow: /wp-content/

Опасность 5: Злоупотребление Clean-param

Clean-param — отличная директива Яндекса для игнорирования параметров URL. Но при неправильном использовании может ломать индексацию.

Ошибка: применение Clean-param к параметрам, которые меняют контент страницы. Например, /category?category_id=5 — если указать Clean-param: category_id /category, Яндекс проигнорирует параметр, и все страницы категорий станут дублями главной /category.

Правильно: применять Clean-param только к параметрам, не меняющим контент — UTM-меткам, сессионным ID, параметрам сортировки.

Опасность 6: Отсутствие sitemap.xml в robots.txt

В robots.txt обязательно должна быть указана ссылка на sitemap:

Sitemap: https://example.ru/sitemap.xml

Если её нет, поисковик может не найти вашу карту сайта, и индексация будет происходить хаотично, через внутренние ссылки. Новые страницы — медленно попадать в индекс.

У сайтов на WordPress с SEO-плагинами (Yoast, Rank Math) sitemap обычно генерируется по адресу /sitemap_index.xml — проверьте и укажите правильный путь.

Опасность 7: Слишком сложные конструкции

Иногда в погоне за «правильным SEO» в robots.txt пишут огромные файлы на 500+ строк с десятками правил и исключений. Чем сложнее файл — тем выше вероятность ошибки.

Мой принцип: robots.txt должен быть простым и читаемым. Минимальный, но достаточный. Обычно 20-40 строк закрывают все потребности типового сайта.

Правильный robots.txt для WordPress (шаблон)

Вот рабочий шаблон, который можно адаптировать:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-json/
Disallow: /*/trackback/
Disallow: /*/feed/
Disallow: /*/attachment/
Disallow: /comments/feed/
Disallow: /search/
Disallow: /?s=
Disallow: /*?replytocom=
Allow: /wp-admin/admin-ajax.php
Allow: /wp-content/

User-agent: Yandex
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-json/
Disallow: /*/trackback/
Disallow: /*/feed/
Disallow: /*/attachment/
Disallow: /comments/feed/
Disallow: /search/
Disallow: /?s=
Disallow: /*?replytocom=
Clean-param: utm_source&utm_medium&utm_campaign&utm_term&utm_content&yclid&gclid /
Allow: /wp-admin/admin-ajax.php
Allow: /wp-content/

Sitemap: https://example.ru/sitemap_index.xml

Правильный robots.txt для Bitrix (шаблон)

User-agent: *
Disallow: /bitrix/
Disallow: /upload/
Disallow: /auth/
Disallow: /personal/
Disallow: /search/
Disallow: /*sort=
Disallow: /*show=
Disallow: /*login=
Disallow: /*register=
Disallow: /*logout=
Disallow: /*print=
Disallow: /*back_url
Allow: /bitrix/components/
Allow: /bitrix/templates/

User-agent: Yandex
Disallow: /bitrix/
Disallow: /upload/
Disallow: /auth/
Disallow: /personal/
Disallow: /search/
Clean-param: sort&show&back_url&utm_source&utm_medium /

Sitemap: https://example.ru/sitemap.xml

Как проверить свой robots.txt

Проверка 1: Открыть файл в браузере

Введите в адресной строке example.ru/robots.txt. Увидите содержимое файла. Если видите «404 Не найдено» — файла нет, срочно создавайте.

Проверка 2: Инструмент в Яндекс.Вебмастере

Зайдите в Вебмастер → «Инструменты» → «Анализ robots.txt». Можно проверить любой URL — доступен он для индексации или заблокирован. Идеальный способ убедиться, что вы случайно не закрыли важные страницы.

Проверка 3: Инструмент в Google Search Console

Аналогичный инструмент у Google: «Настройки» → «robots.txt Tester». Проверяет с точки зрения Googlebot.

Проверка 4: Screaming Frog в режиме соблюдения robots

Запустите сканирование сайта через Screaming Frog с опцией «Respect robots.txt». Увидите, какие URL он смог просканировать, а какие заблокированы.

Частые вопросы по robots.txt

Нужно ли закрывать страницы фильтров в robots.txt?

Лучше закрывать через canonical, а не через robots.txt. Если закрыть через Disallow, Яндекс не сможет даже зайти на страницу, чтобы увидеть ваш canonical. Закрытие в robots — это жёсткая мера для страниц, которые точно не нужны.

Что делать со страницами корзины и личного кабинета?

Их однозначно нужно закрывать в robots.txt. Также добавить noindex на сами страницы. Двойная защита от случайной индексации.

Что делать с версией для печати?

Закрывать в robots через Disallow: /*?print= и применять noindex на самой странице. Версия для печати — типичный дубль основной страницы.

Нужно ли писать директивы отдельно для Яндекса?

Да. User-agent: Yandex отдельно — лучшая практика. Позволяет использовать директивы, понятные только Яндексу (Clean-param, Host).

Что будет, если robots.txt вообще нет?

Яндекс решит, что разрешено сканировать всё. Это не критично для сайта, но неэффективно — будут индексироваться служебные страницы.

Реальный кейс «случайной катастрофы»

Клиент — интернет-магазин косметики. Обратились с жалобой: «Трафик упал в 4 раза за неделю, ничего не меняли, сайт работает нормально».

Первым делом открыл robots.txt. Там:

User-agent: * Disallow: /

Как это случилось? Разработчик делал апдейт темы на тестовом домене, в конфиге стоял запрет индексации. При копировании в продакшн robots.txt перезаписался тестовым. Никто этого не заметил неделю.

Исправление заняло 5 минут — вернули правильный файл. Но на восстановление индексации и позиций ушло 6 недель. Потери за этот период — около 1,5 миллионов рублей несостоявшейся выручки.

Мораль: контролируйте robots.txt. Всегда после любых изменений на сайте.

Ваш план действий сегодня

Откройте example.ru/robots.txt.
Проверьте, нет ли там Disallow: / без уточнений.
Убедитесь, что CSS и JS не закрыты от индексации.
Проверьте, указан ли sitemap.
Через инструмент Вебмастера протестируйте 5-10 важных URL на доступность.
Если найдёте проблемы — исправьте.

Если после проверки понимаете, что robots.txt требует серьёзной доработки — закажите техническую доработку сайта. Сделаю аудит всего технического SEO, включая robots.txt, sitemap, canonical, микроразметку. Приведу в порядок за 1-2 недели.

Если хотите сначала понять, что именно у вас не так — запишитесь на консультацию. Разберём ваш robots.txt, найдём ошибки, дам список правок.

Robots.txt — это маленький файл с огромным влиянием на ваш сайт. Правильные настройки стоят 30 минут работы, неправильные — месяцы потерянной выручки. Выбор очевиден.

Увеличьте позиции и продажи вашего сайта

Профессиональное SEO-продвижение с гарантией результата. Выберите подходящую услугу:

01 SEO-аудит сайта 02 SEO-продвижение 03 Создание сайтов 04 SEO-статьи для сайта

Получить консультацию

Остались вопросы по продвижению?

Меня зовут Анатолий Кузнецов, я SEO-оптимизатор с 20-летним стажем. Разберу ваш сайт, отвечу на вопросы и подскажу, что улучшить для роста позиций в Яндексе и Google.

Связаться со мной →

Николай, в правильном robots закрыты только служебные и мусорные вещи: админка, корзина, страницы поиска по сайту, дубли с параметрами, технические разделы. Обязательно должна быть указана ссылка на sitemap. Чего там быть не должно: запретов на важные разделы, товары, статьи, категории, а также глобального запрета всего сайта, который иногда остаётся с этапа разработки. Ориентир простой: закрываем от робота только то, что не должно попадать в поиск, и никогда не закрываем то, что должно продвигаться.

Ответить

Полина

04.06.2026 в 10:18

Отличная тема. Иду проверять свой robots на опасные настройки по умолчанию.

Роман

04.06.2026 в 08:18

Добавлю: не закрывайте в robots то, что уже в индексе, — для удаления это работает не так, как думают.

Дарья

04.06.2026 в 06:18

Спасибо, что подсветили. Первым делом проверю robots на своём сайте.

Тимур

04.06.2026 в 04:18

Такие тихие настройки страшнее явных ошибок. Никто не ищет, а трафик режется годами.

Вера

04.06.2026 в 01:18

Нашла закрытые важные страницы через Вебмастер. Открыла, отправила на переобход, ждём.

Геннадий

03.06.2026 в 22:18

Проверяйте robots в Вебмастере через инструмент анализа. Он покажет, что реально закрыто для робота.

Оксана

03.06.2026 в 18:18

Одна неверная директива в robots — и месяцы работы над контентом впустую, его просто не видят.

Владислав

03.06.2026 в 13:18

А если я нашёл лишний запрет и убрал его, как быстро закрытые страницы вернутся в индекс?

Admin
04.06.2026 в 04:18

Владислав, не мгновенно. После снятия запрета робот должен заново обойти страницы и вернуть их в индекс, это занимает от нескольких дней до недель в зависимости от траста сайта и частоты обхода. Ускорить можно: добавьте эти страницы в sitemap, поставьте на них внутренние ссылки и отправьте на переобход в Вебмастере. Но переоценка и стабильные позиции придут не сразу после возврата в индекс. Так что исправьте robots, помогите переобходом и дайте время — возврат страниц пойдёт по мере обхода.

Ответить

Лариса

03.06.2026 в 08:18

Плагины и шаблоны любят ставить свои запреты в robots. Проверять надо обязательно после установки.

Артур

03.06.2026 в 02:18

Спасибо, побежал проверять. Про robots все забывают, а он решает, что вообще увидит поиск.

Светлана

02.06.2026 в 21:18

Самое коварное, что такие настройки по умолчанию тихие: сайт работает, а половина не в индексе.

Николай

02.06.2026 в 15:18

А что должно быть в правильном robots, а чего там точно быть не должно? Есть базовый ориентир?

Admin
03.06.2026 в 01:18

Николай, в правильном robots закрыты только служебные и мусорные вещи: админка, корзина, страницы поиска по сайту, дубли с параметрами, технические разделы. Обязательно должна быть указана ссылка на sitemap. Чего там быть не должно: запретов на важные разделы, товары, статьи, категории, а также глобального запрета всего сайта, который иногда остаётся с этапа разработки. Ориентир простой: закрываем от робота только то, что не должно попадать в поиск, и никогда не закрываем то, что должно продвигаться.

Ответить

Марина

02.06.2026 в 09:18

Проверила свой robots после статьи — там висел лишний запрет от прошлого разработчика. Убрала.

Дмитрий

02.06.2026 в 02:18

У меня движок по умолчанию закрывал целый раздел. Нашёл случайно, трафик сразу подрос.

Алина

01.06.2026 в 20:18

А как самому проверить, не закрыл ли мой robots по умолчанию что-то важное от индексации?

Admin
02.06.2026 в 02:18

Алина, проверяется за пять минут. Откройте свой robots.txt по адресу сайт плюс слеш robots.txt и посмотрите на строки Disallow — что именно закрыто. Затем в Вебмастере есть инструмент проверки robots: вставляете нужный URL и видите, разрешён он к обходу или запрещён. Так вы поймёте, не закрыты ли важные страницы. Ещё в Вебмастере смотрите раздел с исключёнными страницами: если важное исключено из-за запрета в robots, это сразу видно. Проверьте так каждую ключевую страницу.

Ответить

Виктор

01.06.2026 в 15:18

Важная тема. Одна строчка в robots по умолчанию может годами закрывать от индексации половину сайта.

Robots.txt, о котором молчат SEO-специалисты: опасные настройки по умолчанию