Мета-тег Robots и файл robots.txt

Анатолий Кузнецов
Анатолий Кузнецов
SEO-оптимизатор с 20-летним стажем. Автор блога hozyindachi.ru о продвижении и доработке сайтов.

Мета-тег robots и файл robots.txt — два инструмента, которыми вы говорите поисковым роботам, что на сайте смотреть, а что обходить стороной. Звучит просто, но именно здесь совершается больше всего фатальных ошибок: одна неосторожная строчка способна выкинуть весь сайт из индекса на месяцы. Я регулярно вижу проекты, которые годами не растут только потому, что когда-то разработчик закрыл от индексации лишнее и забыл вернуть обратно.

Разберёмся по порядку: чем отличается robots.txt от мета-тега robots, когда применять каждый, какие директивы существуют и как не закрыть случайно то, что должно приносить трафик. Это базовая техничка, без которой бессмысленно говорить о продвижении.

robots.txt и мета-тег robots: в чём разница

Файл robots.txt лежит в корне сайта и даёт роботам рекомендации на уровне всего ресурса: какие разделы и типы файлов обходить, где лежит карта сайта. Это привратник на входе — он управляет сканированием, то есть тем, заходит ли робот на страницу вообще.

Мета-тег robots живёт в коде конкретной страницы, в секции head, и управляет индексированием — попадёт ли эта страница в поисковую базу и пойдут ли роботы по ссылкам с неё. Разница принципиальная: robots.txt регулирует доступ, мета-тег — судьбу уже посещённой страницы. Подробно про сам файл я писал в материале про файл robots.txt для сайта.

Если хотите глубже понять механику обхода, посмотрите статью о том, как поисковики индексируют сайты.

Основные директивы robots.txt

Файл состоит из простых правил. Перечислю те, что используются чаще всего:

User-agent — указывает, для какого робота правило. Звёздочка означает всех роботов, можно задать отдельные блоки для Яндекса и Google.

Disallow — запрещает обход указанного пути. Например, служебных страниц, корзины, результатов поиска по сайту.

Allow — явно разрешает обход, обычно чтобы открыть что-то внутри запрещённого раздела.

Sitemap — указывает адрес карты сайта, чтобы робот быстрее находил все страницы. Что это такое и как её сделать, я разбирал в статье про карту сайта sitemap и как её создать.

Раньше для Яндекса использовали ещё директиву Host для указания главного зеркала, но сейчас она не нужна — почему, я объяснял в заметке нужно ли прописывать директиву Host в robots.txt.

Значения мета-тега robots

Мета-тег robots принимает комбинации значений, и их полезно знать наизусть, потому что путаница здесь дорого обходится.

index / noindex — разрешает или запрещает включать страницу в индекс. Noindex — главный инструмент, когда страница нужна людям, но не нужна в поиске.

follow / nofollow — разрешает или запрещает роботу переходить по ссылкам со страницы и передавать по ним вес.

Чаще всего комбинируют так: noindex, follow для служебных страниц, которые сами в поиске не нужны, но через которые робот должен пройти дальше. Подробно про закрытие от индекса я писал в материале про мета-тег noindex.

Если нужно управлять индексацией постранично и тонко, посмотрите разбор постраничного robots и его влияния на продвижение.

Типичные ошибки, которые убивают сайт

Самая страшная ошибка — оставить после разработки строку Disallow: / в robots.txt. Она закрывает от обхода вообще всё. Сайт тихо выпадает из индекса, владелец недоумевает, куда делся трафик, а причина — одна строчка. Реальный разбор такой ситуации есть в статье как одна строчка в robots.txt убирает сайт из Яндекса на полгода.

Вторая частая беда — закрыть в robots.txt то, что нужно индексировать, например важные разделы каталога или статьи. Или наоборот — оставить открытыми мусорные служебные страницы, которые засоряют индекс. О балансе я писал в материале про ошибки robots.txt и sitemap.xml.

Третья ошибка — настройки по умолчанию от CMS. Многие движки ставят robots.txt с опасными правилами из коробки. Что с этим делать, разобрано в заметке про опасные настройки robots.txt по умолчанию.

Четвёртая ошибка — путать robots.txt и мета-тег. Закрытая в robots.txt страница не сканируется, а значит, робот не увидит на ней мета-тег noindex — и она может остаться в индексе как голая ссылка. Чтобы убрать страницу из поиска надёжно, её нужно оставить открытой для обхода, но закрыть мета-тегом noindex.

Как проверить и настроить корректно

После любых изменений обязательно проверьте файл в Яндекс Вебмастере — там есть инструмент анализа robots.txt, который покажет, какие страницы разрешены, а какие закрыты. Откройте несколько важных URL и убедитесь, что они доступны для обхода.

Базовый рабочий принцип такой: закрываем служебное и дубли, оставляем открытым весь полезный контент, обязательно указываем карту сайта. Не копируйте чужой robots.txt вслепую — у каждого движка своя структура. Как настроить файл грамотно, я подробно расписал в материале как настроить robots.txt.

И помните: robots — лишь часть технического здоровья сайта. Если хотите видеть всю картину, начните с разбора того, что такое техническое SEO.

Когда применять robots.txt, а когда мета-тег

На практике выбор между двумя инструментами решается одним вопросом: нужно ли, чтобы страница вообще попала в индекс? Если страница служебная, не несёт пользы для поиска и при этом не должна тратить ресурс робота на обход — её закрывают в robots.txt. Это, например, технические разделы, страницы фильтров и сортировок, результаты внутреннего поиска по сайту.

Если же страница должна быть доступна людям и роботу, но не должна светиться в выдаче, используют мета-тег noindex. Классический случай — страницы благодарности после заявки, версии для печати, отдельные посадочные под рекламу. Робот по ним ходит, ссылки видит, но в индекс страница не попадает.

Важный нюанс, на котором спотыкаются многие: нельзя закрыть страницу в robots.txt и одновременно ждать, что сработает мета-тег noindex. Если обход запрещён, робот просто не увидит мета-тег внутри страницы. Поэтому для надёжного удаления из индекса страницу оставляют открытой для обхода и закрывают именно мета-тегом.

Ещё одна тонкость касается уже проиндексированных страниц. Если вы хотите убрать из поиска то, что уже там есть, закрытие в robots.txt не всегда помогает — страница может остаться в индексе как ссылка без описания. Правильнее снять запрет на обход и поставить noindex, дождавшись переобхода.

Частые вопросы про robots

Что хуже — закрыть лишнее или оставить мусор открытым? Оба варианта вредны, но случайно закрыть нужное опаснее: можно мгновенно потерять трафик. Поэтому любые правки robots.txt проверяйте перед публикацией.

Нужен ли robots.txt маленькому сайту? Да, хотя бы для указания карты сайта и закрытия служебных страниц. Пустой или отсутствующий файл — упущенная возможность управлять обходом.

Как быстро Яндекс реагирует на изменения? После переобхода файла и страниц, обычно в течение нескольких дней. Ускорить можно через переобход в Вебмастере.

Можно ли скопировать чужой robots.txt? Нельзя вслепую: структура URL и движок у каждого сайта свои. Чужой файл может закрыть у вас важное или оставить открытым лишнее.

Короткий чек-лист по robots

Чтобы свести всё воедино, держите под рукой простой список проверок. Пройдитесь по нему на своём сайте — он закрывает большинство типичных проблем с обходом и индексацией.

Первое: в robots.txt нет строки, закрывающей весь сайт от обхода, а служебные разделы и дубли закрыты. Второе: в файле указан адрес карты сайта. Третье: важные разделы и страницы открыты для обхода — проверьте их в Вебмастере. Четвёртое: страницы, которые нужны людям, но не нужны в поиске, закрыты мета-тегом noindex, а не в robots.txt. Пятое: после каждой правки вы проверяете результат инструментом анализа, а не публикуете вслепую.

Этот короткий ритуал занимает несколько минут, но защищает от самой дорогой ошибки в техническом SEO — тихой потери индексации, которую замечают только тогда, когда трафик уже рухнул. Лучше потратить пять минут на проверку, чем полгода на восстановление.


Закажите технический аудит и продвижение

Если вы не уверены, что robots.txt и мета-теги на вашем сайте настроены правильно, не рискуйте — одна ошибка стоит месяцев трафика. На бесплатной консультации я проверю индексацию вашего проекта и подскажу, что исправить в первую очередь. Записаться можно на странице бесплатной SEO-консультации. А за полноценным SEO-продвижением сайтов в Яндексе обращайтесь ко мне напрямую.

Кроме классического SEO я готовлю сайты к выдаче нейросетей и AI-поиска — это направление GEO-продвижения, и техничка здесь играет ещё бо́льшую роль. Подробнее на странице продвижения сайта в нейросетях и AI-поиске.

Посмотреть результаты на реальных проектах можно в разделе кейсов по продвижению сайтов.

Увеличьте позиции и продажи вашего сайта

Профессиональное SEO-продвижение с гарантией результата. Выберите подходящую услугу:

Анатолий Кузнецов — SEO-оптимизатор

Остались вопросы по продвижению?

Меня зовут Анатолий Кузнецов, я SEO-оптимизатор с 20-летним стажем. Разберу ваш сайт, отвечу на вопросы и подскажу, что улучшить для роста позиций в Яндексе и Google.

Связаться со мной →

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

 Нажимая «оставить комментарий» вы принимаетеправила конфиденциальности 

Прокрутить вверх