Дубли страниз из-за регистра букв. Как избежать?
Все привет!
Есть такая проблема.
URL страницы содержит, например, такое AAA789KK
Яндекс, все страницы с aaa789KK или AAA78kk считает дублями, а иногда страницы оригинала AAA789KK считает дублем и добавляет как оригинал aaa789kk,а все остальные вариации выбрасывает
Подскажите, как этого избежать и поможет ли тег canonical в данном случае?
Или кроме aaa789kk что то в урле ещё есть, и они отличаются?
Делайте все урлы под нижний регистр и проблем не будет.
У меня на сайте если делать этот эксперимент то в обеих случаях ведёт на одну и ту же страницу. Но дубли никогда нигде не светили.
Так как правильно должно быть что должен отображать сайт если ввести адрес с учетом регистра? 404 или на ту же страницу привести?
А Путина как и Pr-cy... http://putin.kremlin.ru/bio а так http://putin.kremlin.ru/BIO 404 выдаёт... Хрен его знает, надо подождать ответа специалиста, самому интересно.
MustangOrro, а как вы закроете в роботсе, по какому признаку? ))
Тоже интересно, отпишитесь, если решите эту не стандартную проблему.
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_URI} ^[^A-Z]*[A-Z].*
RewriteRule ^ ${lc:%{REQUEST_URI}} [L,R=301]
</IfModule>
а где нет редиректа отбивает 404
RewriteMap lc int:tolower
Это хостер должен прописать, если у вас нет доступа к настройке в файла виртуального хоста
редирект как и писали выше
Вариант второй:
каноникал в коде в правильном регистре
Каноникал тут до жопы, у вас движек должен формировать корректные урлы. Если урлы сформируются неправильно то и в каноникалах они тоже будут неправильные.