Сайт на вордпресс. При проверке битых ссылок выяснила, что имеется 100500 ссылок типа
https://сайт.ru/?p=2040, половина из них битые, половина - рабочие. Причем ведут они на нормальные страницы, правда, в процессе редиректятся наВопрос - ЧПУ, например, вбиваешь битую/небитую ссыль
https://сайт.ru/?p=2040, открывается
https://сайт.ru/?p=2040, статьи/
Вопрос: как от этой дряни избавиться, мешает ли она сайту, раз редиректится, и откуда вообще взялась (и возьмется ли еще)?
Если адекватно, то - имеет смысл весь "мусор" прикрыть одной директивой:
Disallow: /*?
Если чпу не настроено, то "бороьтся" и не нужно :)
В любом движке генерится иной раз черти-что...
Если url сайта никак не "завязан" на числа, то я бы добавил еще блок директив:
Disallow: */1
...
Disallow: */9
Иногда вылезают эдакие страницы с цифирью id и не отключенные архивы.
Какие нужные url будут, по вашему мнению, "закрыты" по моим рекомендациям?
Страница (блога) содержит несколько вступлений страниц, которые имеют свои собственные уникальные url. Таким образом, страница блога №1 (2-...) - дубликат контента сайта, точнее - сборник "нарезанных" из статей вступлений (по паре абзацев). Копипаст "самого себя".
Мнений на сей счет много. Если есть карта сайта, то я лично пагинацию - "убиваю". Не "заради принципа", а для простоты. В итоге в индексе - остаются только статьи, без намека на дубли.
Кроме страниц пагинации "нужных" знаков вопроса (?) в url сайта с адекватным чпу быть не должно.