Все посты
Обновлено 9999+ 9 Знания

Битые ссылки — чем вредят сайту, как найти и исправить

Инструменты и сервисы для поиска битых ссылок и методы работы с ними.

Представим, что на сайте опубликовали статью и поставили ссылку на источник — Википедию. Страницу Википедии удалили, владелец сайта об этом не знает, ссылка в статье все еще стоит, но теперь ведет на страницу 404.

Еще пример: в интернет-магазине товар переместили в новую категорию или настроили ЧПУ, но не сделали редиректы со старых URL. Теперь старые ссылки на товары ведут на несуществующие страницы.

Эти ссылки называют битыми, по таким ссылкам пользователь никуда не попадет.

Что такое битые ссылки?

Битые ссылки — это гиперссылки, которые ведут на несуществующие файлы или страницы ресурса. Они могут быть внутренними — в рамках одного сайта, или внешними — на страницы стороннего ресурса.

Страницы отдают серверу код ответа 404 Not Found — он означает, что сам сервер найден, но документа по такому адресу не существует, имя файла в коде и на сервере не совпадает. К примеру, файл на сервере удалили или переместили, и теперь он доступен по новому адресу. То же самое может произойти, если в URL есть ошибка.

Откуда берутся битые ссылки?

Они могут появится по техническим причинам, при изменении структуры сайта или по ошибке пользователя. Вот самые распространенные причины:

  • Удаление страницы или контента

Если удалили страницу с устаревшим контентом или по ошибке удалили актуальную, ссылка на нее останется, но работать не будет;

  • Изменение URL без настройки 301 редиректа

Изменения в URL могут привести к битым ссылкам. Это может произойти при обновлении структуры сайта, смене родительского раздела или при попытке оптимизации URL;

  • Изменение ассортимента интернет-магазина

Когда товары заканчиваются на складе и их страницы удаляют, нерабочие ссылки могут остаться;

  • Неверная настройка переезда на HTTPS-протокол

Если при переходе на HTTPS-протокол не настроили перенаправление с HTTP;

  • Технические ошибки на сайте или на стороне сервера

Ошибки в настройке веб-сервера, проблемы с ЧПУ, неправильное кэширование страниц;

  • Случайные ошибки и человеческий фактор

Например, если при внутренней перелинковке администратор сайта скопировал ссылку не полностью;

  • Устаревание перелинковки

Нужно регулярно проверять внутренние ссылки, чтобы все они вели на существующие страницы;

  • Специальный или случайный ввод в адресную строку браузера несуществующих адресов

Это может произойти, когда пользователи вручную вводят URL и делают опечатку.

Чем вредны битые ссылки на сайте

Санкций от поисковых систем за неработающие ссылки нет, но они портят пользователям впечатление от сайта и увеличивают отказы.

Ухудшение поведенческих факторов

Пользователь надеялся получить дополнительную информацию, а по ссылке ошибка — ожидания не оправдались. Если он попал на страницу 404, он может закрыть вкладку с сайтом и пойти к конкурентам.

Проблемы с передачей ссылочного веса

Такие ссылки вредят внутренней перелинковке и ссылочной массе сайта в целом — через нерабочую ссылку не передается вес ни со своего сайта, ни с чужих.

Уменьшение краулингового бюджета, но на самом деле это миф

Есть мнение, что битые ссылки отрицательно влияют на краулинговый бюджет — ресурсы, которые ПС выделяет на сканирование сайта. Пишут, что краулер потратит лимиты на бесполезный обход битых ссылок и из-за этого проигнорирует важные страницы.

По словам Джона Мюллера, сотрудника Google, это не так: 4хх ошибки не приводят к снижению краулингового бюджета. Бот повторно сканирует эти страницы, чтобы убедиться, что они закрыты, но делает это не в ущерб остальным страницам.

Еще Джон Мюллер отмечает, что неважно, сколько страниц с ошибками 404 есть на сайте, сами по себе они не могут снизить рейтинг остальных страниц.

4хх ошибки не крадут бюджет краулера. Но это касается не всех страниц 4хх.

Ошибка 404 SOFT

В блоге Google перечисляют страницы, которые негативно влияют на распределение бюджета, и среди них есть «мягкие страницы ошибок», то есть 404 SOFT.

404 SOFT возникают, если для несуществующей страницы сервер должен ответить кодом 404 или 410, а вместо этого отвечает HTTP-кодом ответа 200 OK. В таком случае краулер воспринимает страницу как обычно, сканирует ее и тратит краулинговый бюджет вместо обхода действительно важных страниц. Ошибки 404 SOFT тратят краулинговый бюджет.

Большое количество страниц 404 точно не принесет никакого положительно эффекта, а навредить может, поэтому лучше их исправить. Найти страницы 404 помогут специальные сервисы и инструменты.

Как искать битые ссылки

Для совсем небольших сайтов можно обойтись ручным способом — пролистать все страницы и посмотреть все ссылки на сайте или посмотреть ссылки из выдачи ПС по запросу «site: вашсайт.ру»

Сервисы могут показывать неточные результаты, так что комбинируйте несколько инструментов, чтобы найти как можно больше страниц с ошибками.

Google Search Console

Страницы с ошибками 404 Search Console отображает в разделе «Страницы». В таблице «Почему эти страницы не индексируются» перечислены причины и количество страниц с каждым типом проблемы. Если кликнуть по причине, можно увидеть список страниц.

Страницы, которые не индексируются, в Search Console
Список проблем индексации в Search Console

В консоли перечислены ссылки на момент последнего обхода сайта краулером, поэтому в режиме реального времени отследить ссылки не получится.

Удобно отслеживать 404 ошибки можно с помощью Google Tag Manager. Как это сделать — в руководстве.

Яндекс.Вебмастер

Сервис отображает битые ссылки в разделе «Ссылки». Он покажет примеры внутренних неработающих ссылок по данным последнего обхода сайта ботом Яндекса.

битые ссылки в Яндекс Вебмастере
Битые ссылки в Метрике, скриншот SEO блиц vc.ru/u/166702-seo-blic

Online Broken Link Checker

Англоязычный онлайн-инструмент для проверки битых ссылок. Бесплатно проверяет до 3000 страниц, смотрит только HTML-документы, то есть ссылок на изображения, видео и другое мультимедиа не будет.

бесплатный инструмент для поиска битых ссылок
Результаты проверки сайта

Если вам нужно просканировать больше страниц, проверить подпапки (URL-адреса с /) или отдельные страницы, экспортировать результаты, авторы инструмента предлагают связаться с ними.

Netpeak Spider

Русскоязычная программа для анализа ссылок на сайте. Есть бесплатная версия со всеми функциями, но без возможности копировать, экспортировать и сохранять отчёты.

(Пример анализа сайта программой: netpeak spider ru screen.jpg)
Спайдер анализирует неограниченное количество URL на предмет битых ссылок, картинок, редиректов, а также имеет дополнительные возможности — формирование интерактивных отчётов, интеграции с GA, GSC и Яндекс.Метрика, мульти-доменное сканирование, проверка AMP и разметки и многое другое. Стоит 374,40 долларов в год.

Xenu's Link Sleuth

Бесплатная англоязычная программа для анализа ссылок на сайте. Инструмент захватывает корневую страницу и проверяет ее, переходя на отдельные ссылки для поиска ошибок. Есть настройка работы программы с фильтрами и количеством одновременных потоков проверки.

настройка Xenu's Link Sleuth
Настройка программы

После завершения проверки Xenu's Link Sleuth генерирует HTML-отчет с результатами.

как работать с инструментом Xenu's Link Sleuth
Пример результата работы программы

Работает бесплатно, но проверка больших ресурсов занимает довольно много времени.

Screaming Frog

Англоязычная программа для анализа ссылок на сайте. Есть бесплатная версия с проверкой 500 страниц.

как работать в программе Screaming Frog
Пример анализа сайта программой

Платный тариф открывает неограниченное количество страниц для анализа и дополнительные возможности — формирование отчетов, интеграцию с GA, сканирование и проверка AMP и разметки и другие. Стоит 149 евро в год.

Broken Link Checker, плагин для WordPress

Плагин отслеживает ссылки на страницах сайта — в блоге, комментариях и меню — и оповещает веб-мастера через панель инструментов или по электронной почте о том, что ссылка стала битой. Настройки позволяют работать с этими ссылками — запрещать поисковым ботам переходить по ним, менять и исправлять ссылки внутри плагина, не редактируя сам пост.

интерфейс плагина для WordPress Broken Link Checker
Пример работы плагина, скриншот oddstyle.ru

Доступен бесплатно, есть русификация.

Расширение Check My Links для Google Chrome

Оно подходит для проверки конкретных страниц, позволяет наглядно увидеть местоположение ссылок и их вид.

После установки расширения в браузере в правом верхнем углу появится иконка. Перейдите на нужную страницу, где будете анализировать ссылки, и кликните на иконку. Расширение проверит ссылки, выведет счетчик и подкрасит ссылки цветами. Ссылки, ведущие на страницы 404, будут красными.

работа с расширением Check My Links для Google Chrome
Пример работы расширения

Расширение работает бесплатно, но подходит для небольших сайтов или работы с конкретными страницами.

PR-CY

Найти битые ссылки можно с помощью нашего сервиса для анализа сайта. В разделе «Аудит сайта», где сервис показывает результаты проверки внутренних страниц, можно найти все страницы с кодом ответа 404.

Поиск страниц 404 в сервисе PR-CY
Список страниц с кодом ответа 404
Попробовать сервис

Что делать с битыми ссылками и несуществующими страницами

Итак, с помощью сервисов вы нашли ссылки, которые ведут на недоступные страницы. Варианты дальнейших действий зависят от самой ссылки.

Внешняя исходящая ссылка

Ссылка с вашего сайта ведет на другой сайт, но конечная страница не работает. Найдите такие ссылки и удалите, если содержание не пострадает, или замените на актуальные. Если это коммерческая ссылка, которую нельзя удалить и заменить, свяжитесь с партнером и скажите о проблеме с его ресурсом.

На поиске ссылок на страницы 404 на чужих сайтах базируется один из методов получения обратных ссылок. Веб-мастеры отслеживают трафиковые статьи по своей теме, находят в материале нерабочие ссылки, которые ведут другие статьи, и пишут свои посты на эту тему. Потом они обращаются к автору блога и предлагают заменить битую ссылку на их материал. Выигрывают обе стороны: веб-мастер получает ссылку на свой сайт, а автор блога закрывает битую ссылку хорошим материалом и не отправляет пользователей читать несуществующую страницу.

Обратная ссылка

Чтобы проверить, работают ли ссылки, которые вы разместили на других ресурсах, попробуйте наш бесплатный инструмент. Введите адрес целевой страницы и страниц, на которых установлены ссылки. Инструмент покажет анкор, количество внешних и внутренних ссылок на странице-доноре и проблемы со ссылкой, если они есть.

Проверка обратных ссылок PR-CY
Инструмент для проверки бэклинков

Если ссылка не работает, но страница-донор существует, попросите заменить URL на актуальный. Может быть так, что страницы-донора больше нет. В этом случае напишите владельцу сайта и попросите поставить ссылку с другой, рабочей, страницы.

Внутренняя ссылка

Что делать с битыми ссылками внутри своего сайта:

  • Если страницу по ссылке удалили случайно, восстановите ее;

  • Замените битую ссылку в тексте актуальной;

  • Если существует страница с аналогичным контентом по новому адресу, к примеру, если вы переместили товар в другую категорию с изменением URL, настройте 301 редирект;

  • Если замены для такой страницы нет, удалите ссылку.

Почитать по теме:
Как удалить устаревший контент из поисковых систем Яндекс и Google

Что делать с недоступными страницами

Даже если вы удалите все ссылки на несуществующие страницы, они все равно будут появляться — пользователь ошибется в адресе, произойдет технический сбой или что-то еще, поэтому рекомендуем сделать настройку.

Страница с ошибкой должна возвращать код ответа 404 (недоступно) или 410 (удалено), но не 220 ОК. Код 410 сервер посылает, если ресурс удален и недоступен, а расположение копии неизвестно. Если документ может быть восстановлен, то лучше передать 404.

Стандартная страница 404 побуждает закрыть вкладку. Настройте свою страницу 404, чтобы возвращать пользователей на сайт и направлять на целевые страницы. Разместите на ней навигацию к работающим разделам сайта, ссылку на главную или что-то смешное и интересное. Это позволит вернуть пользователей к работе с сайтом и оставить хорошее впечатление о компании.

пример страницы 404
Страница 404 сайта Airbnb предлагает другие разделы сайта
анимированная страница 404
На сайте Github со страницы с ошибкой можно использовать поиск, войти в учетную запись, перейти в другие разделы сайта
страница 404
Страница 404 сайта HeadHunter отправляет к полезным разделам сайта
оформление страницы 404
Страница 404 у Blizzard в шутку обвиняет «Спасибо, вы сломали нам страницу» и предлагает перейти к другим разделам
пример оригинальной страницы 404
Страница 404 сайта 9GAG предлагает скачать приложение, если сайт недоступен
интересный пример страницы 404 на сайте
Глаза на странице сайта hakim.se/404 следят за курсором, есть ссылка на главную

Следующий шаг — разобраться со страницами, которых не существует. Ссылки на них все еще могут быть в индексе ПС, поэтому их нужно удалить.

Как удалить несуществующие страницы из индекса

Удалить страницы из индекса можно через панели веб-мастеров Яндекс и Google.

Чтобы страница удалилась из индекса, сервер при обращении к ней должен возвращать ошибку 404. Если страница существует, но не должна участвовать в поисковой выдаче, закройте ее от индексации правилами robots.txt или мета-тегом noindex.

При следующем обходе сайта роботом запросы на удаление будут выполнены, а страницы исчезнут из результатов поиска.

Возьмите под контроль продвижение своего сайта
Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.
🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.

Теги поста или какие разделы почитать еще:

Комментарии (9)
WebmageS   25.07.2019 10:29
Полезно!
Elena_Zhmurina   25.07.2019 12:33
Рады, что полезно :)
neironshmidt   25.07.2019 17:00
Отличная статья, много что узнал!
Elena_Zhmurina   26.07.2019 09:45
Спасибо, приятно!
AlterEgoRex   30.07.2019 15:15
Внимание! Поисковый робот не обнаружит директиву noindex, если страница заблокирована в файле robots.txt. Такая страница может быть представлена в результатах поиска (например, если на нее есть ссылка на другой странице).
и есть много других факторов почему страницы, ранее закрытые, будут в поиске
https://clck.ru/HMKPo
gene4god   06.08.2019 15:22
Спасибо, пригодилось в плане автоматизации.
gene4god   06.08.2019 15:32
Однако, Xenu был воспринят моей защитой как спам сканер и заблокировал мой же IP )))
Dwachaya   01.09.2023 17:04
А вот расскажите, как можно исключить из поиска тьму (буквально десятки тысяч) спамных внешних ссылок, которые ставит непонятно кто на помоечные и даже всякие фишинговые сайты, причем на всякие вложения и изначально неверные ссылки нашего сайта. Их так много с разных линкопомоек, что сайт маркируется (у вас в том числе) как закупающий 50% SEO-ссылок, при том, что мы их вообще не покупаем ... Думаю, это и на SEO как-то косвенно влияет.

Очень похоже на прогоны по типу "прогон - убийца конкурентов", которыми занимаются "черные сеошники", но вот как это все вычистить из яндекс и гугл, ума не приложу.
Inna_S   05.09.2023 00:45
Вообще Google говорит, что поисковые боты такие ссылки просто игнорируют, если не похоже, что их купили. Но если все равно беспокоитесь, есть сервис для отклонения ненужных бэклинков: https://search.google.com/search-console/disavow-links
К данной записи нельзя добавлять комментарии, т.к. она очень старая.
🔥 Внутренняя оптимизация сайта — большой гайд по самостоятельной проверке
Эффективная внутренняя перелинковка: как работать с ссылками на сайте
Сколько ссылок nofollow и dofollow должно быть на сайте