⚡ Факторы ранжирования Яндекс оказались в слитом коде

Они похожи на факторы ранжирования, которые использует Google. UPD: Яндекс дали официальный комментарий.

После самого масштабного слива в истории компании на прошлой неделе в интернет попали куски исходного кода многих сервисов Яндекса. Сегодня оказалось, что в публичный доступ попали 1922 фактора ранжирования поисковой системы: из них 244 отмечены как неиспользуемые (unused), а 988 как отмененные (deprecated). Остаются 690 потенциальных факторов ранжирования Яндекс.

Компания уверяла, что сами алгоритмы поиска остались нетронутыми, но сегодня выпустила официальный комментарий.

Цитаты:
«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория — инструмента, с помощью которого разработчики компании работают с кодом. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».

«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...> Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».

«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».

Все факторы находятся в файле, содержащим описание по единой структуре: название, ссылка на внутренний ресурс (к нему доступ закрыт), AntiSeoUpperBound и описание. Хоть часть из них и ссылается на внутреннюю, недоступную нам документацию, все равно интересно посмотреть, какие факторы были в доке.

Факторы ранжирования сайта в Яндексе

Первым фактором в списке значится PageRank, многие находят это занятным. Что еще в списке:

пессимизация (сильная пессимизация сводит PageRank до нуля);
возраст ссылок;
обратные ссылки (с главных страниц важнее, чем с внутренних);
баланс хороших и плохих ссылок;
анкоры обратных ссылок;
трафик и процент органического трафика;
возраст документа и время его последнего обновления;
надежность хоста (меньше ошибок 40x/50x — лучше);
количество / в URL (много — плохо);
цифры в URL (цифры — плохо);
ключевые слова в URL (оптимально до трех слов);
уровень вложенности URL;
средняя позиция домена по всем запросам;
пользовательские факторы: CTR, last-click, добавление в закладки;
количество поисковых запросов;
наличие трафика из Википедии;
наличие карт js-api на странице (например, Google Maps);
встроенное видео на странице (поврежденное — плохо);
количество рекламы на странице;
качество текста.

Интересен еще отдельный фактор — случайность попадания в топ, чтобы проверить поведение пользователей. Так что если вы обнаружили свой URL в топе, не спешите связывать это с вашими последними действиями, возможно, это эксперимент Яндекса.

Больше пунктов с подробностями в материале Liftweb, а также на зарубежном сайте, где сделали поиск по всем факторам. Можно, например, посмотреть все, которые касаются ссылок.

Расскажите в комментариях, какие-то факторы оказались для вас сюрпризом или все они предсказуемы?

Возьмите под контроль продвижение своего сайта

Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.

🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.

Автор:
Илья

Теги поста или какие разделы почитать еще:

Комментарии (8)

Эдуард Краснов 31.01.2023 12:06

Непонятно следующее:

"количество (/) в URL (много — плохо);" - как правило "/" являются признаком хорошо организованной структуры, к примеру: "главная/статьи/медицина/стоматология/протезирование/название статьи" - 5 слешей. И за что тут пессимизировать?

"пессимизация (сильная сводит PageRank до нуля);" - это что такое? Пессимизация из-за чего?

"количество рекламы на странице;" - какое количество рекламы допустимо? Как, к примеру СМИ выжить без рекламы?

Да, еще интересна степень влияния каждого фактора!

Ответить

Igor Kom 02.02.2023 05:34

главная/статьи/медицина/стоматология/протезирование/название статьи
Здесь про URL речь, не про структурирование breadcrumbs. Воспринимает как вложенные папки поисковая машина, так всегда было. Так и незачем столько создавать в URL папок. В "хлебных крошках" указывается структура, у меня сразу под горизонтальным меню в InctantCMS

Ответить

Эдуард Краснов 02.02.2023 19:24

Я про url и писал. Каждая папка (рубрика, подрубрика) формируют url.
Можно конечно заморочиться и запилить url без папок, но сам принцип непонятен, почему поисковики писсимизируют из-за понятной структуры, когда по одному урлу уже понятно где статья находится (а названия папок это ж те же ключи, которые имеют отношение и к статье).

Ответить

Нина 31.01.2023 13:40

"возраст документа и его последнего обновления" - чем старше тем лучше или наоборот?

Ответить

Эдуард Краснов 31.01.2023 19:05

С точки зрения машины, чем новее документ - тем он должен быть лучше, содержать более свежую и актуальную инфу. Хотя, надо учитывать специфику у статей и новостей.

Ответить

Ivan Feduleev 01.02.2023 09:26

Из того, что удалось найти, чем старше, тем лучше. Вместо создания новых страниц, лучше вносить изменения в старый документ, обновлять его.

Ответить

qwerdie 31.01.2023 21:22

это конечно збс... но при стаже от 3-х лет ничего нового... хочется лишь добавить "нюансы"... хотя надо смотреть код "слитого" там есть градации влияния от которых пересечения факторов на ++ можно узнать... хотя они очень очевидны после 2-х 3-х заходов на анализ даже новичку... скорее их чих-пых хуками можно назвать...

если делаешь 4+ для людей на своем сайте то все эти факторы и приколы вообще не нужны... ты полюбому будешь Топ Топ-тать в кайф под любимы музон...

Ответить

Александр Чертов 01.02.2023 13:57

что такое "4+ для людей"?

Ответить

К данной записи нельзя добавлять комментарии, т.к. она очень старая.