SEO Сообщество: Спрашивайте и помогайте

Присоединяйтесь к сообществу профессиональных веб-мастеров PR-CY, отвечайте на вопросы коллег и задавайте свои.

Q&A SEO

Подскажите, хорошо ли составлен файл robots?

RomF80 RomF80  
0
  13.11.2016 19:01       1 828    
Подскажите пожалуйста, правильно ли составлен файл http://firstconsul.ru/robots.txt , сайт на Вордпресс, если есть какие-нибудь недостатки посоветуйте пожалуйста, что стоит добавить.

Ответы на пост (18) Написать ответ
vituson vituson
2363
13.11.2016 20:57
После коррекции файла, прогоните несколько разных нужных вам урлов в кабинетах ВМ Гугла и Яндекса, чтобы проверить, что важные страницы не закрыты для индексации. Также список дополните теми страницами, которые индексироваться не должны, чтобы проверить, правильно ли работает запрет.
0
Решение
akeelow akeelow
9
13.11.2016 19:58
Я сделал так https://pmwot.ru/robots.txt
0
Petroff Petroff
698
13.11.2016 20:43
Disallow: /*? можно убрать, оставить только Disallow: /*?*
* закрывает любую последовательность, в т.ч. и пустую.

p.s. Но надо еще раз правила перечитать
0
vituson vituson
2363
13.11.2016 20:58
Host прилепите к блоку правил Яндекс. Другие пауки эту директиву не понимают.
0
Sergexpert Sergexpert
451
13.11.2016 20:02
Откровенно говоря чем он будет короче, тем лучше.
1
Sergexpert Sergexpert
451
13.11.2016 20:04
И вообще один дурак сделал его портянкой остальные берут с него пример. На ворпрессе можно отрегулировать все плагином.
0
RomF80 RomF80
0
13.11.2016 20:10
Почему Вы считаете, что чем короче тем лучше описание файла?
0
vituson vituson
2363
13.11.2016 20:36
У вас включено ЧПУ, надо добавить вариант с вопросительным знаком, плюс добавить несколько правил. Также "сайтмап" надо отделить пустой строкой, т.к. иначе он у вас "для всех кроме яндекса". Ниже более правильный вариант.

User-agent: Yandex
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-content/cache
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: */trackback
Disallow: */feed
Disallow: /cgi-bin
Disallow: *?s=
Disallow: /*?replytocom
Disallow: /?p=*
Disallow: /*?replytocom
Disallow: /tag/
Disallow: /page/
Disallow: /201*/
Disallow: /author
Disallow: /wp-json/
Host: firstconsul.ru

User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-content/cache
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: */trackback
Disallow: */feed
Disallow: /cgi-bin
Disallow: *?s=
Disallow: /*?replytocom
Disallow: /?p=*
Disallow: /*?replytocom
Disallow: /tag/
Disallow: /page/
Disallow: /201*/
Disallow: /author
Disallow: /wp-json/

Sitemap: http://firstconsul.ru/sitemap.xml


0
vituson vituson
2363
13.11.2016 20:37
одно лишнее затесалось - Disallow: /*?replytocom
0
vituson vituson
2363
13.11.2016 20:41
Если теги нужно индексировать то правило запрета индексации тегов, конечно, убрать.
0
RomF80 RomF80
0
13.11.2016 20:49
Спасибо большое.
0
vituson vituson
2363
13.11.2016 20:55
Пожалуйста.
0
RomF80 RomF80
0
13.11.2016 21:10
что означает Disallow: /201*/
0
vituson vituson
2363
13.11.2016 21:12
Disallow: /201*/

Запрет индексации архивов записей с 2010 по 2019 год.
0
Petroff Petroff
698
13.11.2016 20:46
Можно через xenu прогнать. Она покажет все ?, p, s и т.д.
0
vituson vituson
2363
13.11.2016 20:55
1. "s" не покажет, это страницы поиска.
2. WP - хорошо изученная CMS, и для нее есть более-менее стандартный роботс. Изобретать ничего не нужно.
0
Максим Масов Максим Масов
0
14.11.2016 07:50
Кстати если прописать пароль и логин от ftp чтоб мусор убрать с сайта ??? Я боюсь что уведут ??))))
0
Максим Масов Максим Масов
0
14.11.2016 07:52
Xenu боюсь пароль с логином от FTP давать Вдруг уведут ????)))))
0