Дубли страниз из-за регистра букв. Как избежать?

MustangOrro MustangOrro  
4
  06.06.2018 00:27       448     Помощь  
Все привет!

Есть такая проблема.
URL страницы содержит, например, такое AAA789KK
Яндекс, все страницы с aaa789KK или AAA78kk считает дублями, а иногда страницы оригинала AAA789KK считает дублем и добавляет как оригинал aaa789kk,а все остальные вариации выбрасывает

Подскажите, как этого избежать и поможет ли тег canonical в данном случае?

Ответы на пост (15) Написать ответ
Krauzer Krauzer
2090
06.06.2018 00:31
То есть, у вас есть страница, сайт.ru/AAA789KK и страница сайт.ru/aaa789kk? Если так, то это не яндекс считает, это просто адреса совпадают, чего не должно быть.
Или кроме aaa789kk что то в урле ещё есть, и они отличаются?
0
MustangOrro MustangOrro
4
06.06.2018 00:33
Так, что в этом случае посоветуете, если таких станиц более 1000? Закрыть в роботе?
0
Krauzer Krauzer
2090
06.06.2018 13:51
Страницы с разным контентом? Если да, то разные урлы к каждой. Если страницы по факту являются дублями, то нафиг они не нужны.
Делайте все урлы под нижний регистр и проблем не будет.
0
prizrakkomunizma prizrakkomunizma
0
06.06.2018 01:49
Что то здесь не то... Странная фигня... например набираю http://pr-cy.ru/qa/ всё ок, а если набирать http://pr-cy.ru/QA/ то 404 показывает.
У меня на сайте если делать этот эксперимент то в обеих случаях ведёт на одну и ту же страницу. Но дубли никогда нигде не светили.
Так как правильно должно быть что должен отображать сайт если ввести адрес с учетом регистра? 404 или на ту же страницу привести?
0
MustangOrro MustangOrro
4
06.06.2018 01:51
Одна и та же страница! 404 нет ошибки.
0
Krauzer Krauzer
2090
06.06.2018 13:52
У меня в одном браузере так, а другой автоматом перекидывает урлы на нижний регистр.
0
prizrakkomunizma prizrakkomunizma
0
06.06.2018 02:10
И у меня одна и та же, на трьох сайтах проверил. но дублей никогда не показывало... Так же на сайте https://yoast.com/wordpress/ и https://yoast.com/WORDPRESS/ показывает одну и ту же страницу...
А Путина как и Pr-cy... http://putin.kremlin.ru/bio а так http://putin.kremlin.ru/BIO 404 выдаёт... Хрен его знает, надо подождать ответа специалиста, самому интересно.
0
sungoldline sungoldline
1260
06.06.2018 03:13
Попытаюсь предположить что какой то плагин не корректно работает или где то в functions.php не правильно задано условие. Так же возможно, что какой то хук конфликтует с чем то. Это нужно разбираться. Вообще то правильно должно отдавать 404 или редирект на следующую страницу начинающуюся буквой или словосочетанием. Когда то давно попадалось пару сайтов на WP с таким дефектом. Долго не заморачивался, сносил все плагины установленные "кулибиными" и переустанавливал CMS, потому что не было времени и не хотелось разбираться в хаосе на сайтах. Легче и быстрей было переустановить. Пока писал, вспомнил, что был еще сайт на джумле с этой же проблемой. Скажу однозначно - это косяк. Тоже проверил пяток своих сайтов, происходит как я описал - 404 или редирект.
MustangOrro, а как вы закроете в роботсе, по какому признаку? ))
Тоже интересно, отпишитесь, если решите эту не стандартную проблему.
1
sungoldline sungoldline
1260
06.06.2018 03:21
Решил проверить догадку и подтвердилось. У меня сайтах где стоит в .htaccess это, идет редирект на прописные буквы
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_URI} ^[^A-Z]*[A-Z].*
RewriteRule ^ ${lc:%{REQUEST_URI}} [L,R=301]
</IfModule>
а где нет редиректа отбивает 404
1
sungoldline sungoldline
1260
06.06.2018 03:37
P.S. забыл добавить, в настройках сервера должно быть указано

RewriteMap lc int:tolower

Это хостер должен прописать, если у вас нет доступа к настройке в файла виртуального хоста
0
MustangOrro MustangOrro
4
06.06.2018 14:02
Если мы это пропишем, то у нас вылетают из регистра более 1000 страниц с урлом "АААА" и со временем залетают с урлом "ааа"? Я правильно понял? Нам бы хотелось как-то безболезненно это пройти.
0
iloveliveuzia iloveliveuzia
73
06.06.2018 09:45
Вариант первый:
редирект как и писали выше

Вариант второй:
каноникал в коде в правильном регистре
0
MustangOrro MustangOrro
4
06.06.2018 13:56
Что в вашем понимании правильный регист?
0
grintroll grintroll
52
06.06.2018 10:22
У нормально настроеной маршрутизации всегда есть редирект на нижний регистр чтоб небыло такой херни.

Каноникал тут до жопы, у вас движек должен формировать корректные урлы. Если урлы сформируются неправильно то и в каноникалах они тоже будут неправильные.
0
MustangOrro MustangOrro
4
06.06.2018 13:56
Правильный урл в вашем понимании - это с прописными буквами? (маленькие)
0