SEO Сообщество: Спрашивайте и помогайте

Присоединяйтесь к сообществу профессиональных веб-мастеров PR-CY, отвечайте на вопросы коллег и задавайте свои.

Q&A SEO

Генерируются левые ссылки. Как избавиться?

feniks79 feniks79  
92
  25.10.2017 17:32       1 442    
Сайт на вордпресс. При проверке битых ссылок выяснила, что имеется 100500 ссылок типа https://сайт.ru/?p=2040, половина из них битые, половина - рабочие. Причем ведут они на нормальные страницы, правда, в процессе редиректятся наВопрос -  ЧПУ, например, вбиваешь битую/небитую ссыль https://сайт.ru/?p=2040, открывается https://сайт.ru/?p=2040, статьи/
Вопрос: как от этой дряни избавиться, мешает ли она сайту, раз редиректится, и откуда вообще взялась (и возьмется ли еще)?

Ответы на пост (14) Написать ответ
sansan sansan
1680
25.10.2017 21:48
Вопрос в том, как сейчас настроено чпу.

Если адекватно, то - имеет смысл весь "мусор" прикрыть одной директивой:
Disallow: /*?

Если чпу не настроено, то "бороьтся" и не нужно :)
0
Решение
feniks79 feniks79
92
25.10.2017 22:18
Сейчас симпатичные ЧПУ, все по-людски сделала. Спасибище, Сансан, пойду закрывать))
0
sansan sansan
1680
25.10.2017 22:25
Не за что.
В любом движке генерится иной раз черти-что...
Если url сайта никак не "завязан" на числа, то я бы добавил еще блок директив:

Disallow: */1
...
Disallow: */9

Иногда вылезают эдакие страницы с цифирью id и не отключенные архивы.
0
feniks79 feniks79
92
25.10.2017 22:28
Чисел вообще быть не должно, я поэтому и в шок такой впала, когда увидела. Спасибо еще раз, пойду добавлять правила от циферной дряни))
0
alexakap alexakap
325
25.10.2017 23:38
sansan, если Вы wordpress не видели, то не нужно советовать не понятно что. В этом движке урлы изначально через параметры формировались. А после Вас, ТС закроет от индексации много страниц
0
sansan sansan
1680
25.10.2017 23:52
WP иногда попадается.
Какие нужные url будут, по вашему мнению, "закрыты" по моим рекомендациям?
0
alexakap alexakap
325
26.10.2017 00:00
Disallow: /*? закроет любые параметры. Если есть нормальные, небитые ссылки на статьи с адресом /?p= то они закроются. Такие ссылки на вп относительно недавно были. Сейчас в поиске встречаются такие страницы, это не дубли и не спам. Но от ТС практически нет информации, поэтому сложно понять чем помочь
0
alexakap alexakap
325
26.10.2017 00:05
Ну уж точно не Disallow: /*?
0
sansan sansan
1680
26.10.2017 00:18
?p= - такого вида внутренние ссылки - точно нужны? (страницы пагинации, наверное)

Страница (блога) содержит несколько вступлений страниц, которые имеют свои собственные уникальные url. Таким образом, страница блога №1 (2-...) - дубликат контента сайта, точнее - сборник "нарезанных" из статей вступлений (по паре абзацев). Копипаст "самого себя".

Мнений на сей счет много. Если есть карта сайта, то я лично пагинацию - "убиваю". Не "заради принципа", а для простоты. В итоге в индексе - остаются только статьи, без намека на дубли.
Кроме страниц пагинации "нужных" знаков вопроса (?) в url сайта с адекватным чпу быть не должно.
0
alexakap alexakap
325
26.10.2017 00:24
Вы просто не знаете, поэтому не вижу смысла объяснять ))) Тема для меня закрыта
0
alexakap alexakap
325
25.10.2017 19:06
?p=2040 это урлы "по умолчанию" с id записи 2040. Так сложно сказать откуда беруться
0
feniks79 feniks79
92
25.10.2017 19:25
То есть там, получается, практически с каждой записи есть такие "по умолчанию", там идут от 1912 до 3729, правда, не подряд...
0
alexakap alexakap
325
25.10.2017 19:44
Могу предположить, что сначала урлы были настроены в админке "по умолчанию", т.е. ?p=id. Это в постоянных ссылках в админке настраивается. Потом просто поменяли на какие-то чпу, а старые остались. Попробуйте перейти по адресу адрес сайта/feed и там скорее всего увидите какому ?p соответствует чпу, а где нет чпу. Если включены какие-то загрузчики rss, то их нужно отключить. Можно как-то фид выгрузить на комп и по нему работать и исправлять старые и битые ссылки. Возможно есть какой-то плагин, который на автомате старые ссылки преобразует
0
feniks79 feniks79
92
25.10.2017 19:50
Такое и правда может быть, домен я перекупала, на нем сайт до этого уже был. Видимо, наследство какое-то вылезает((
0