Library
seoforger
SnS Standart Pack
Управление содержимым
Контент
Cтраницы / Информация
Обзоры
Заметки
Метки
Контент
Комментарии
Связи
Карточки контента
Типы карточек
Библиотека
Книги / Библиотека СЕО
Главы / Тексты
Авторы / Авторы
Персонажи
Жанры
Продвижение
FAQ
Примечания
Анонсы
Новости
Материалы
Инструменты
Мета-описания
Ключевые слова
Черновики
Ссылки
Экспресс-правка
Сервисы
Решения
Бренды
Обзоры
Страницы / Информация
Новости / Новости
Книги / Библиотека СЕО
Главы / Тексты
Управление сайтом
On-Page SEO
Просмотр логов
Пользователи
Пользователи
Визиты
Профили
Уведомления
Рассылки
Проверка ссылок
Главная
Фронтенд (Realtime)
Задачи
Начало сессии:
18 февраля 2026 г. в 03:06:35 GMT+3
Mega Menu
Книги
5
Главная
Структура
Создать
•
Справочник по SEO
21-07-2025 в 10:46:41
•
Руководство по платформе ShopnSeo
05-06-2025 в 15:31:28
•
Конструкторы сайтов и CMS
21-05-2024 в 14:32:43
•
Гид по On-Page SEO
28-03-2024 в 12:52:25
•
Полный гид по SEO
28-03-2024 в 12:49:34
Главы
5
Главная
Структура
Создать
•
Поисковая оптимизация (SEO)
10-09-2025 в 01:34:05
•
SEO контент
10-09-2025 в 01:32:55
•
Log file. Лог-файл
10-09-2025 в 01:31:05
•
DMOZ
10-09-2025 в 01:30:47
•
Author Authority / Авторитет автора
10-09-2025 в 01:30:16
Страницы
5
Главная
Структура
Создать
•
Копия страницы - Цены
18-02-2026 в 02:59:37
•
Копия страницы - Информация о блоге
18-02-2026 в 02:59:22
•
Копия страницы - Портфолио
18-02-2026 в 02:58:46
•
Копия страницы - Копия страницы - О проекте
18-02-2026 в 01:47:29
•
Копия страницы - High Load Hosting
18-02-2026 в 01:47:29
Анонсы
0
Главная
Структура
Создать
Новости
5
Главная
Структура
Создать
•
Новая AI-модель для выявления мошеннических рекламодателей
12-01-2026 в 16:57:50
•
Google объяснил ошибку «Индекс без контента»
12-01-2026 в 16:54:26
•
Google тестирует синюю кнопку Send вместо AI Mode
12-01-2026 в 16:49:12
•
Google советует ориентироваться на поведение аудитории
12-01-2026 в 16:47:10
•
Google тестирует и убирает AI Overviews
12-01-2026 в 16:45:31
Материалы
0
Главная
Структура
Создать
FAQ
5
Главная
Структура
Создать
•
Что такое UI-дизайн?
05-09-2025 в 09:20:39
•
Что такое брендинг?
05-09-2025 в 09:20:37
•
Что такое дизайн?
05-09-2025 в 09:20:36
•
Что такое веб-дизайн?
05-09-2025 в 09:20:35
•
Что такое UX-дизайн?
05-09-2025 в 09:20:33
Примечания
0
Главная
Структура
Создать
Express Menu
Раздел
Товар
Страницы
Книги
Главы
Блоги
Посты
Новости
Материалы
Создать
Раздел
Продукт
Страницу
Книгу
Главу
Блог
Пост
Новости
Материал
Анонс
Черновик
Управление сайтом
Главная
Контакты
Пользователи
Профили пользователей
LinkGazer
Структура сервера
Почистить кэш навигатора
Новых сообщений нет
Смотреть все сообщения
Гость
Профиль
class
Настройки
Помощь
Выйти
Главная
Книги
Главы
Настройки мета-тегов robots.txt
Правка
'#6. Тексты : texts';
'Library_ChapterController_actionUpdate_';
'#library_chapter_update_';
VirtualityCMS
Количество проиндексированных страниц уменьшается
VirtualityCMS
Идентификатор ссылки (англ.)
vigbo-copy
Статус:
Активен
Описание
Количество проиндексированных страниц уменьшается
Идентификатор ссылки (англ.)
kolichestvo-proindeksirovannykh-stranits-umenshayetsya-03022
Статус:
Архив
117. Настройки мета-тегов robots.txt. Правка
Архив
Экспресс-правка
Разметка
ред. Summernote
ред. Quill
ред. CKEditor
ред. Trumbowyg
ред. Imperavi
ред. Jodit
Общая информация
Название
id
(статус)
117
(2)
Идентификатор ссылки (англ.)
nastroyki-meta-tegov-robotstxt-97936
Сайт (ID сайта)
. #3
Смотреть на сайте
https://panel.seoforger/texts/prodvinutoye-tekhnicheskoye-seo/nastroyki-meta-tegov-robotstxt-97936/
Время последнего обновления
27-08-2025 в 11:38:16
Ссылка в БД
https://shopnseo.ru/texts/prodvinutoye-tekhnicheskoye-seo/nastroyki-meta-tegov-robotstxt-97936/
Картинка
https://static.shopnseo.ru/cache/6/117-nastroyki-meta-tegov-robotstxt-97936_col-12.webp
Полное название и описание
Полное название
Лучшие практики настройки мета-тегов robots и robots.txt
Описание главы
Изучение того, как настроить файл robots.txt и мета-теги robots, является важным элементом успеха в техническом SEO. Это краткое руководство поможет вам правильно их реализовать.
Как правило описание должно иметь около 150 знаков. Оно используется для заполнения мета-тега Description веб-страницы.
Сейчас используется -
0
символов
Скопировать
Вставить
Сохранить
Описание скопировано!
Описание вставлено!
Редактировать комментарии, примечания, метки и персонажи
Комментарии
Примечания
Добавить примечание
Метки
Выбрать метки seoforger.ru:
Показать остальные метки
веб-разработка
шаблоны
искусственный интеллект
оптимизация
продвижение
контент
сайт-визитка
бизнес-сайт
одностраничник
SEO
веб-дизайн
интернет-магазин
корпоративный сайт
верстка
хостинг
техническое SEO
техподдержка
сервер
веб-аналитика
дизайн
креативное агентство
фронтенд
маркетинг
премиальный сайт
кафе/рестораны
портфолио
bootstrap
представительский сайт
ссылки
аналитика
интернет
обновление
разработка
ShopnSEO
ключевые слова
CMS
редакторская правка
sass
скорость загрузки
социальная сеть
туризм
домен
медицина
недвижимость
ранжирование
Shopnseo Creative
уровни
вакансии
автотехника
бизнес
блог
финансы
ГуглАналитика4
краулинг
мебель
новости
образование
правка
стандарт
wordpress
юридическое агентство
реклама
Добавить новые метки, через запятую:
Отметить персонажи
Открыть список
Отметить:
Добавить имена новых персонажей, через запятую:
Полный текст
< > & " ' « » – — … • · ← → ↑ ↓ ↔
Дополнительные символы
Юридические:
© ® ™
Валюты:
€ £ ¥ ¢
Типографика:
§ ¶ ° ± × ÷
Дроби:
½ ⅓ ⅔ ¼ ¾ ⅛ ⅜ ⅝ ⅞
Греческие:
α β γ δ ε λ μ π σ ω Δ Σ Ω
Математические:
≈ ≠ ≤ ≥ ∞ √ ∑ ∫ ∂ ∇
<p style="text-align: right;">автор: <a title="Go to Author Page" href="https://www.searchenginejournal.com/author/anna-crowe/">Anna Crowe</a></p> <p>Изучение того, как настроить файл robots.txt и мета-теги robots, является важным элементом успеха в техническом SEO. Это краткое руководство поможет вам правильно их реализовать.</p> <p>Может быть, это только у меня, или слова "мета-теги robots" и "robots.txt" звучат как что-то, что сказал бы Шварценеггер в "Терминаторе 2"?</p> <p>Именно поэтому я начал заниматься SEO – казалось, будущее, но в то время чрезмерно техническое для моих навыков.</p> <p>Надеюсь, это руководство сделает настройку мета-тегов robots и файлов robots.txt менее вызывающей тошноту. Давайте начнем.</p> <h2>Meta Robots Tags против Robots.txt</h2> <p>Прежде чем мы погрузимся в основы того, что такое мета-теги robots и файлы robots.txt, важно знать, что нет одной стороны, которая лучше использовать в SEO.</p> <p>Файлы robots.txt указывают краулерам, что следует краулить по всему сайту.</p> <p>В то время как мета-теги robots углубляются в детали конкретной страницы.</p> <p>Я предпочитаю использовать мета-теги robots для многих вещей, которые другие специалисты SEO могут считать слишком сложными в файле robots.txt.</p> <p>Нет правильного или неправильного ответа. Это личное предпочтение на основе вашего опыта.</p> <h3>Что такое Robots.txt?</h3> <p>Файл robots.txt сообщает краулерам, что следует краулить.</p> <p>Это часть протокола исключения краулеров (REP).</p> <p>Googlebot – пример краулера.</p> <p>Google разворачивает Googlebot для обхода веб-сайтов и записи информации о сайте для понимания того, как ранжировать сайт в результатах поиска Google.</p> <p>Вы можете найти файл robots.txt любого сайта, добавив /robots.txt после веб-адреса, например, так:</p> <p>www.mywebsite.com/robots.txt</p> <p>Вот как выглядит базовый, свежий файл robots.txt:</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_60983483521704897397689.webp" alt="базовый файл robots.txt" width="480" height="96" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Звездочка * после user-agent говорит краулерам, что файл robots.txt предназначен для всех ботов, посещающих сайт.</p> <p>Косая черта / после "Disallow" говорит роботу не переходить на любые страницы сайта.</p> <p>Вот пример файла robots.txt от Moz.</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/moz-robots-5e31a4a33399b-480x698.webp" alt="пример файла robots.txt от Moz." style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"><br>Вы видите, что они сообщают краулерам, какие страницы краулить, используя user-agents и директивы. Я расскажу о них чуть позже.</p> <h3>Почему важен файл Robots.txt?</h3> <p>Я не могу сказать, сколько клиентов обращаются ко мне после миграции сайта или запуска нового сайта и спрашивают меня: Почему мой сайт не ранжируется после месяцев работы?</p> <p>Я бы сказал, что 60% причина в том, что файл robots.txt не был правильно обновлен.</p> <p>Это означает, что ваш файл robots.txt по-прежнему выглядит так:</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_71651754131704897480117.webp" alt="Пример файла robots.txt" width="480" height="96" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Это блокирует все веб-краулеры, посещающие ваш сайт.</p> <p>Еще одна причина, по которой файл robots.txt важен, заключается в том, что у Google есть такая штука, как бюджет краула.</p> <p>Google говорит:</p> <blockquote> <p>«Googlebot разработан так, чтобы быть хорошим гражданином веба. Краулинг – его главный приоритет, при этом он обеспечивает нормальное взаимодействие с пользователями, посещающими сайт. Мы называем это «лимитом скорости краула», который ограничивает максимальную скорость получения данных для данного сайта.</p> <p>Проще говоря, это представляет собой количество одновременных параллельных соединений, которые Googlebot может использовать для краулинга сайта, а также время ожидания между получениями данных».</p> </blockquote> <p>Так что, если у вас большой сайт с низкокачественными страницами, которые вы не хотите, чтобы Google краулил, вы можете сказать Google «Запретить» их в вашем файле robots.txt.</p> <p>Это освободит ваш бюджет краула, чтобы он краулил только высококачественные страницы, которые вы хотите, чтобы Google ранжировал для вас.</p> <p>На данный момент нет четких и строгих правил для файлов robots.txt... пока.</p> <p>Google объявил в июле 2019 года о предложении начать внедрение определенных стандартов, но пока что я придерживаюсь лучших практик, которые использовала в течение последних нескольких лет.</p> <h2>Основы Robots.txt</h2> <h3>Как использовать Robots.txt</h3> <p>Использование robots.txt крайне важно для успешного SEO.</p> <p>Однако непонимание его работы может заставить вас почесать затылок, пытаясь понять, почему вы не ранжируетесь.</p> <p>Поисковые системы будут краулить и индексировать ваш сайт на основе того, что вы сообщите им в файле robots.txt с использованием директив и выражений.</p> <p>Ниже приведены распространенные директивы robots.txt, которые вам следует знать:</p> <ul> <li><strong>User-agent: *</strong> – Это первая строка в вашем файле robots.txt, чтобы объяснить краулерам правила того, что вы хотите, чтобы они краулили на вашем сайте. Звездочка информирует всех пауков.</li> <li><strong>User-agent: Googlebot </strong>– Это говорит только о том, что вы хотите, чтобы краулер Google краулил.</li> <li><strong>Disallow: / </strong>– Это говорит всем краулерам не краулировать ваш весь сайт.</li> <li><strong>Disallow: </strong>– Это говорит всем краулерам краулировать ваш весь сайт.</li> <li><strong>Disallow: /staging/ </strong>– Это говорит всем краулерам игнорировать ваш тестовый сайт.</li> <li><strong>Disallow: /ebooks/* .pdf </strong>– Это говорит краулерам игнорировать все ваши форматы PDF, которые могут вызывать проблемы с дублированием контента.</li> </ul> <h3>User-agent: Googlebot</h3> <p><strong>Disallow: /images/</strong> – Это говорит только краулеру Googlebot игнорировать все изображения на вашем сайте.</p> <p><strong>*</strong> – Это рассматривается как шаблон, представляющий любую последовательность символов.</p> <p><strong>$ </strong>– Используется для сопоставления конца URL.</p> <p>Для создания файла robots.txt я использую Yoast для WordPress. Он уже интегрируется с другими функциями SEO на моих сайтах.</p> <p>Но прежде чем вы начнете создавать свой файл robots.txt, вот несколько основных моментов, которые стоит помнить:</p> <p>Правильно форматируйте свой файл robots.txt. <a title="SEMrush" href="https://shopnseo.ru/texts/faq/rasskazhite-ob-instrumente-dlya-seo-semrush-38939" target="_blank" rel="noopener">SEMrush</a> приводит отличный пример того, как должен быть правильно отформатирован файл robots.txt. Вы видите, что структура следует следующему порядку: User-agent → Disallow → Allow → Host → Sitemap. Это позволяет паукам поисковых систем получать доступ к категориям и веб-страницам в правильном порядке.</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_35104911941704897761046.webp" alt="пример как правильно отформатирован файл robots.txt" width="480" height="810" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Убедитесь, что каждый URL, который вы хотите "Allow:" или "Disallow:", размещен на отдельной строке, как это делает Best Buy ниже. И не разделяйте пробелами.<br><img class="img-fluid" src="https://static.shopnseo.ru/uploads/webceo-robots-5e31b3b1209b8-480x200.webp" alt="пример файла robots.txt" width="480" height="200" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Всегда используйте строчные буквы для названия вашего файла robots.txt, как это делает WebCEO.<br><img class="img-fluid" src="https://static.shopnseo.ru/uploads/webceo-robots-5e31b3b1209b8-768x321.webp" alt="пример файла robots.txt" width="768" height="321" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <ul> <li>Не используйте никакие специальные символы, кроме * и $. Другие символы не распознаются.</li> <li>Создавайте отдельные файлы robots.txt для разных поддоменов. Например, "hubspot.com" и "blog.hubspot.com" имеют индивидуальные файлы и оба имеют разные файлы robots.txt.</li> <li>Используйте # для комментариев в вашем файле robots.txt. Краулеры не уважают строки с символом #.</li> <li>Если страница запрещена в файлах robots.txt, равновесие ссылок не передается.</li> <li>Никогда не используйте robots.txt для защиты или блокировки конфиденциальных данных.</li> </ul> <h3>Что скрывать с помощью Robots.txt</h3> <p>Файлы robots.txt часто используются для исключения определенных каталогов, категорий или страниц из SERP.</p> <p>Вы можете исключить, используя директиву "disallow".</p> <p>Вот несколько обычных страниц, которые я скрываю с использованием файла robots.txt:</p> <ul> <li>Страницы с дублирующимся контентом (часто контент для печати)</li> <li>Страницы пагинации</li> <li>Динамические страницы продуктов и услуг</li> <li>Страницы учетной записи</li> <li>Страницы администратора</li> <li>Корзина для покупок</li> <li>Чаты</li> <li>Страницы благодарности</li> </ul> <p>Это особенно полезно для электронной коммерции с использованием параметров, как это делает Macy's.</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_4972568021704900923169.webp" alt="пример файла robots.txt" width="900" height="600" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>И вы можете видеть здесь, как я запретил страницу благодарности.<br><img class="img-fluid" src="https://static.shopnseo.ru/uploads/leadfeeder-sitemap-5e31b5248237b-768x154.webp" alt="пример файла robots.txt" width="768" height="154" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Важно знать, что не все краулеры будут следовать вашему файлу robots.txt.</p> <p>Плохие боты могут полностью игнорировать ваш файл robots.txt, поэтому убедитесь, что на заблокированных страницах нет конфиденциальных данных.</p> <h3>Общие ошибки в файле robots.txt</h3> <p>После управления файлами robots.txt более 10 лет я вижу несколько общих ошибок:</p> <h4>Ошибка №1: Верхний регистр в имени файла</h4> <p>Возможное имя файла – robots.txt, а не Robots.txt или ROBOTS.TXT.</p> <p>Следуйте строчным буквам, всегда, когда речь идет о SEO.</p> <h4>Ошибка №2: Не помещение файла robots.txt в главный каталог</h4> <p>Если вы хотите, чтобы ваш файл robots.txt был найден, вы должны поместить его в главный каталог вашего сайта.</p> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>www.mysite.com/tshirts/robots.txt</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>www.mysite.com/robots.txt</code></p> <h4>Ошибка №3: Неправильно отформатированный User-Agent</h4> <p><br><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>Disallow: Googlebot</code></p> <p>Правильно</p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow: /</code></p> <h4>Ошибка №4: Упоминание нескольких каталогов в одной строке 'Disallow'</h4> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>Disallow: /css/ /cgi-bin/ /images/</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>Disallow: /css/</code></p> <p style="padding-left: 40px;"><code>Disallow: /cgi-bin/</code></p> <p style="padding-left: 40px;"><code>Disallow: /images/</code></p> <h4>Ошибка №5: Пустая строка в 'User-Agent'</h4> <p>Неправильно</p> <p style="padding-left: 40px;"><code>User-agent:</code></p> <p style="padding-left: 40px;"><code>Disallow:</code></p> <p style="padding-left: 40px;">Правильно</p> <p style="padding-left: 40px;"><code>User-agent: *</code></p> <p style="padding-left: 40px;"><code>Disallow:</code></p> <h4>Ошибка №6: Зеркальные веб-сайты и URL-адреса в директиве Host</h4> <p>Будьте внимательны при упоминании директив 'host', чтобы поисковые системы правильно вас понимали:</p> <p>Неправильно</p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow: /cgi-bin</code></p> <p>Правильно</p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow: /cgi-bin</code></p> <p style="padding-left: 40px;"><code>Host: www.site.com</code></p> <p>Если ваш сайт имеет https, правильный вариант:</p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow: /cgi-bin</code></p> <p style="padding-left: 40px;"><code>Host: https://www.site.com</code></p> <h4>Ошибка №7: Перечисление всех файлов внутри каталога</h4> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: *</code></p> <p style="padding-left: 40px;"><code>Disallow: /pajamas/flannel.html</code></p> <p style="padding-left: 40px;"><code>Disallow: /pajamas/corduroy.html</code></p> <p style="padding-left: 40px;"><code>Disallow: /pajamas/cashmere.html</code></p> <p><strong>Правильно</strong></p> <p>User-agent: *</p> <p style="padding-left: 40px;"><code>Disallow: /pajamas/</code></p> <p style="padding-left: 40px;"><code>Disallow: /shirts/</code></p> <h4>Ошибка №8: Отсутствие инструкций Disallow</h4> <p>Инструкции Disallow необходимы, чтобы поисковые боты понимали вашу цель.</p> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Host: www.mysite.com</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow:</code></p> <p style="padding-left: 40px;"><code>Host: www.mysite.com</code></p> <h4>Ошибка №9: Блокировка всего сайта</h4> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow: /</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: Googlebot</code></p> <p style="padding-left: 40px;"><code>Disallow:</code></p> <h4>Ошибка №10: Использование различных директив в разделе *</h4> <p>Неправильно</p> <p style="padding-left: 40px;"><code>User-agent: *</code></p> <p style="padding-left: 40px;"><code>Disallow: /css/</code></p> <p style="padding-left: 40px;"><code>Host: www.example.com</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>User-agent: *</code></p> <p style="padding-left: 40px;"><code>Disallow: /css/</code></p> <h4>Ошибка №11: Неверный HTTP-заголовок</h4> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>Content-Type: text/html</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>Content-Type: text/plain</code></p> <h4>Ошибка №12: Отсутствие Sitemap</h4> <p>Всегда размещайте свои карты сайта внизу вашего файла robots.txt.</p> <p><strong>Неправильно</strong></p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_23442118231704901411297.webp" alt="пример файла robots.txt" width="294" height="156" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p><strong>Правильно</strong></p> <p><strong><img class="img-fluid" src="https://static.shopnseo.ru/uploads/robots-correct-sitemap-5e31b5920f8b4-480x126.webp" alt="пример файла robots.txt" width="480" height="126" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></strong></p> <h4>Ошибка №13: Использование noindex</h4> <p>Google объявил в 2019 году, что больше не будет учитывать директиву noindex, используемую в файлах robots.txt.</p> <p>Так что вместо этого используйте мета-теги robots, о которых я расскажу ниже.</p> <p><strong>Неправильно</strong></p> <p style="padding-left: 40px;"><code>noindex thank you robots</code></p> <p><strong>Правильно</strong></p> <p style="padding-left: 40px;"><code>robots thank you</code></p> <h4>Ошибка №14: Запрещение страницы в файле robots.txt, но при этом создание ссылок на нее</h4> <p>Если вы запретили страницу в файле robots.txt, Google все равно будет индексировать эту страницу, если у вас есть внутренние ссылки на нее.</p> <p>Вам нужно удалить эти ссылки, чтобы пауки полностью прекратили индексацию этой страницы.</p> <p>Если вы когда-либо сомневаетесь, вы можете проверить, какие страницы индексируются, в отчете о покрытии Google Search Console.</p> <p>Вы должны увидеть что-то вроде этого:</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/robots-google-search-console-5e31b5f56f430-768x376.webp" alt="Google Search Console" width="768" height="376" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>А также вы можете использовать <a href="https://www.google.com/webmasters/tools/robots-testing-tool?siteUrl=https://www.leadfeeder.com/">инструмент проверки robots.txt</a> от Google.</p> <p>Однако, если вы используете инструмент проверки наличия мобильной версии от Google, он не будет следовать вашим правилам в файле robots.txt.</p> <p>Мета-теги Robots (также называемые директивами мета-тегов robots) – это фрагменты HTML-кода, которые сообщают поисковым роботам, как индексировать страницы на вашем веб-сайте.</p> <h2>Что такое мета-теги robots?</h2> <p>Мета-теги robots добавляются в раздел <head> веб-страницы. Вот пример:</p> <p style="padding-left: 40px;"><code><meta name="robots" content="noindex" /></code></p> <p>Мета-теги robots состоят из двух частей.</p> <p>Первая часть тега – <strong>name</strong>='''.</p> <p>Здесь вы идентифицируете user-agent. Например, "Googlebot".</p> <p>Вторая часть тега – <strong>content</strong>=''.</p> <p>Здесь вы сообщаете ботам, что вы хотите, чтобы они делали.</p> <h3>Типы мета-тегов robots</h3> <p>Мета-теги robots имеют два типа тегов:</p> <ul> <li>Мета-тег robots.</li> <li>X-robots-tag.</li> </ul> <h4>Тип 1: Мета-тег Robots</h4> <p>Мета-теги robots часто используются маркетологами SEO. Он позволяет вам сообщать user-agent'ам (думайте о Googlebot) об индексации конкретных областей. Вот пример:</p> <p><code><meta name="googlebot" content="noindex, nofollow"></code></p> <p>Этот мета-тег robots говорит краулеру Google, Googlebot, не индексировать страницу в поисковых системах и не следовать по обратным ссылкам. Таким образом, эта страница не будет частью SERPs. Я бы использовал этот мета-тег robots для страницы благодарности после загрузки электронной книги.</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_52486526841704901967353.webp" alt="мета-тег robots для страницы благодарности" width="768" height="421" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Теперь, если вы посмотрите на код страницы, вы увидите, что там указаны noindex и nofollow.</p> <p><img class="img-fluid" src="https://static.shopnseo.ru/uploads/mceu_27041459451704902055061.webp" alt="код страницы" width="768" height="335" style="display: block; margin-left: auto; margin-right: auto;" loading="lazy"></p> <p>Если вы используете различные директивы мета-тегов Robots для различных пользовательских агентов поиска, вам придется использовать отдельные теги для каждого бота.</p> <p>Крайне важно не размещать мета-теги Robots за пределами раздела <head>.</p> <h4>Тип 2: X-robots-tag</h4> <p>x-robots-tag позволяет делать то же самое, что и мета-теги robots, но в заголовках HTTP-ответа. По сути, это предоставляет больше функциональности, чем мета-теги robots. Однако для этого вам понадобится доступ к файлам .php, .htaccess или сервера.</p> <p>Например, если вы хотите заблокировать изображение или видео, но не всю страницу, вы бы использовали x-robots-tag вместо этого.</p> <h3>Параметры мета-тегов robots</h3> <p>Есть много способов использования директив мета-тегов robots в коде. Но сначала вам нужно понять, что это за директивы и что они делают. Вот разбор директив мета-тегов robots:</p> <ul> <li><strong>all</strong> – Нет ограничений для индексации и содержимого. Эта директива используется по умолчанию. Она не влияет на работу поисковых систем. Я использовал ее как ярлык для index, follow.</li> <li><strong>index</strong> – Позволяет поисковым системам индексировать эту страницу в их результатах поиска. Это значение по умолчанию. Вам не нужно добавлять его на свои страницы.</li> <li><strong>noindex</strong> – Удаляет страницу из индекса и результатов поиска. Это означает, что пользователи не найдут ваш сайт или перейдут по ссылке.</li> <li><strong>follow</strong> – Позволяет поисковым системам следовать за внутренними и внешними обратными ссылками на этой странице.</li> <li><strong>nofollow</strong> – Не разрешать следовать за внутренними и внешними обратными ссылками. Это означает, что эти ссылки не передадут вес ссылок.</li> <li><strong>none</strong> – То же, что и мета-теги noindex и nofollow.</li> <li><strong>noarchive</strong> – Не показывать ссылку "Сохраненная копия" в SERPs.</li> <li><strong>nosnippet</strong> – Не показывать расширенную версию описания этой страницы в SERPs.</li> <li><strong>notranslate</strong> – Не предлагать перевод этой страницы в SERPs.</li> <li><strong>noimageindex</strong> – Не индексировать изображения на странице.</li> <li><strong>unavailable_after: [RFC-850 date/time]</strong> – Не показывать эту страницу в SERPs после указанной даты/времени. Используйте формат RFC 850.</li> <li><strong>max-snippet</strong> – Устанавливает максимальное количество символов в мета-описании.</li> <li><strong>max-video-preview</strong> – Устанавливает количество секунд, в течение которых будет предварительный просмотр видео.</li> <li><strong>max-image-preview</strong> – Устанавливает максимальный размер предварительного просмотра изображения.</li> </ul> <p>Иногда разные поисковые системы принимают разные параметры мета-тегов. Вот их разбивка:</p> <table> <tbody> <tr> <td><strong>Value</strong></td> <td><strong>Google</strong></td> <td><strong>Bing</strong></td> <td><strong>Yandex</strong></td> </tr> <tr> <td>index</td> <td>Yes</td> <td>Yes</td> <td>Yes</td> </tr> <tr> <td>noindex</td> <td>Yes</td> <td>Yes</td> <td>Yes</td> </tr> <tr> <td>none</td> <td>Yes</td> <td>Doubt</td> <td>Yes</td> </tr> <tr> <td>noimageindex</td> <td>Yes</td> <td>No</td> <td>No</td> </tr> <tr> <td>follow</td> <td>Yes</td> <td>Doubt</td> <td>Yes</td> </tr> <tr> <td>nofollow</td> <td>Yes</td> <td>Yes</td> <td>Yes</td> </tr> <tr> <td>noarchive</td> <td>Yes</td> <td>Yes</td> <td>Yes</td> </tr> <tr> <td>nosnippet</td> <td>Yes</td> <td>No</td> <td>No</td> </tr> <tr> <td>notranslate</td> <td>Yes</td> <td>No</td> <td>No</td> </tr> <tr> <td>unavailable_after</td> <td>Yes</td> <td>No</td> <td>No</td> </tr> </tbody> </table> <h2>Как использовать мета-теги Robots</h2> <p>Если у вас есть веб-сайт на WordPress, у вас есть множество вариантов плагинов для настройки ваших мета-тегов Robots. Я предпочитаю использовать Yoast. Это всё-в-одном плагин SEO для WordPress, предоставляющий множество функций. Тем не менее, существуют также плагины Meta Tags Manager и GA Meta Tags.</p> <p>Для пользователей Joomla я рекомендую EFSEO и Tag Meta.</p> <p>Вне зависимости от того, на чем построен ваш сайт, вот три совета по использованию мета-тегов Robots:</p> <ol> <li>Сохраняйте регистр. Поисковые системы распознают атрибуты, значения и параметры как в верхнем, так и в нижнем регистре. Я рекомендую придерживаться нижнего регистра для улучшения читаемости кода. Кроме того, если вы SEO-специалист, лучше приучить себя использовать нижний регистр.</li> <li>Избегайте множественных тегов <meta>. Использование нескольких мета-тегов вызовет конфликты в коде. Используйте несколько значений в вашем теге <meta>, например, так: <meta name="robots" content="noindex, nofollow">.</li> <li>Не используйте противоречащие мета-теги, чтобы избежать ошибок индексации. Например, если у вас есть несколько строк кода с мета-тегами, такими как <meta name="robots" content="follow"> и <meta name="robots" content="nofollow">, будет учтено только "nofollow". Это происходит потому, что роботы первыми применяют ограничительные значения.</li> </ol> <h3>Файл Robots.txt и Мета-теги Robots работают вместе</h3> <p>Одна из самых распространенных ошибок, которую я вижу при работе с веб-сайтами своих клиентов, – это несоответствие файла robots.txt тому, что указано в мета-тегах Robots.</p> <p>Например, файл robots.txt скрывает страницу от индексации, но мета-теги Robots делают обратное.</p> <p>Помните пример от Leadfeeder, который я показала выше?</p> <p>Таким образом, вы заметите, что эта страница благодарности запрещена в файле robots.txt и использует мета-теги Robots noindex, nofollow.</p> <p>По моему опыту, Google придает приоритет тому, что запрещено в файле robots.txt.</p> <p>Однако вы можете избежать несоответствия мета-тегов Robots и robots.txt, четко сообщив поисковым системам, какие страницы следует индексировать, а какие нет.</p> <h2>Заключение</h2> <p>Если вы все еще вспоминаете дни, когда покупка фильма в Blockbuster в торговом центре казалась актуальной, то использование robots.txt или мета-тегов может показаться вам сложным.</p> <p>Но если вы уже насладились просмотром "Странных вещей", добро пожаловать в будущее.</p> <p>Надеюсь, этот руководство предоставило вам больше информации о основах robots.txt и мета-тегов. Если после прочтения этого поста вы надеялись на роботов на реактивных ранцах и путешествие во времени, мне жаль.</p>
Скопировано в буфер!
Вставлено из буфера!
Карточка текста
Карточки текста
Тема
Персонажи
Изменить дату действия. 18/02/2026
Выбрать дату
Идея текста
Сюжет
План действий
Заметки
Редакторские правки
Настройки мета-тегов robots.txt
Персонажи
Идея текста
Сюжет
План действий
Заметки
Дополнительные поля
Дополнительные поля отсутствуют