Все посты
4810 8 Новости (Архив)

⚡ Факторы ранжирования Яндекс оказались в слитом коде

Они похожи на факторы ранжирования, которые использует Google. UPD: Яндекс дали официальный комментарий.

После самого масштабного слива в истории компании на прошлой неделе в интернет попали куски исходного кода многих сервисов Яндекса. Сегодня оказалось, что в публичный доступ попали 1922 фактора ранжирования поисковой системы: из них 244 отмечены как неиспользуемые (unused), а 988 как отмененные (deprecated). Остаются 690 потенциальных факторов ранжирования Яндекс.

Компания уверяла, что сами алгоритмы поиска остались нетронутыми, но сегодня выпустила официальный комментарий.

Цитаты:
«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория — инструмента, с помощью которого разработчики компании работают с кодом. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».

«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...> Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».

«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».

    Все факторы находятся в файле, содержащим описание по единой структуре: название, ссылка на внутренний ресурс (к нему доступ закрыт), AntiSeoUpperBound и описание. Хоть часть из них и ссылается на внутреннюю, недоступную нам документацию, все равно интересно посмотреть, какие факторы были в доке.

    Факторы ранжирования сайта в Яндексе

    Первым фактором в списке значится PageRank, многие находят это занятным. Что еще в списке:

    • пессимизация (сильная пессимизация сводит PageRank до нуля);
    • возраст ссылок;
    • обратные ссылки (с главных страниц важнее, чем с внутренних);
    • баланс хороших и плохих ссылок;
    • анкоры обратных ссылок;
    • трафик и процент органического трафика;
    • возраст документа и время его последнего обновления;
    • надежность хоста (меньше ошибок 40x/50x — лучше);
    • количество / в URL (много — плохо);
    • цифры в URL (цифры — плохо);
    • ключевые слова в URL (оптимально до трех слов);
    • уровень вложенности URL;
    • средняя позиция домена по всем запросам;
    • пользовательские факторы: CTR, last-click, добавление в закладки;
    • количество поисковых запросов;
    • наличие трафика из Википедии;
    • наличие карт js-api на странице (например, Google Maps);
    • встроенное видео на странице (поврежденное — плохо);
    • количество рекламы на странице;
    • качество текста.
    Интересен еще отдельный фактор — случайность попадания в топ, чтобы проверить поведение пользователей. Так что если вы обнаружили свой URL в топе, не спешите связывать это с вашими последними действиями, возможно, это эксперимент Яндекса.

    Больше пунктов с подробностями в материале Liftweb, а также на зарубежном сайте, где сделали поиск по всем факторам. Можно, например, посмотреть все, которые касаются ссылок.

    Расскажите в комментариях, какие-то факторы оказались для вас сюрпризом или все они предсказуемы?

    Возьмите под контроль продвижение своего сайта
    Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.
    🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.

    Теги поста или какие разделы почитать еще:

    Комментарии (8)
    Непонятно следующее:

    "количество (/) в URL (много — плохо);" - как правило "/" являются признаком хорошо организованной структуры, к примеру: "главная/статьи/медицина/стоматология/протезирование/название статьи" - 5 слешей. И за что тут пессимизировать?

    "пессимизация (сильная сводит PageRank до нуля);" - это что такое? Пессимизация из-за чего?


    "количество рекламы на странице;" - какое количество рекламы допустимо? Как, к примеру СМИ выжить без рекламы?


    Да, еще интересна степень влияния каждого фактора!

    Igor Kom   02.02.2023 05:34
    главная/статьи/медицина/стоматология/протезирование/название статьи
    Здесь про URL речь, не про структурирование breadcrumbs. Воспринимает как вложенные папки поисковая машина, так всегда было. Так и незачем столько создавать в URL папок. В "хлебных крошках" указывается структура, у меня сразу под горизонтальным меню в InctantCMS
    Я про url и писал. Каждая папка (рубрика, подрубрика) формируют url.
    Можно конечно заморочиться и запилить url без папок, но сам принцип непонятен, почему поисковики писсимизируют из-за понятной структуры, когда по одному урлу уже понятно где статья находится (а названия папок это ж те же ключи, которые имеют отношение и к статье).
    Нина   31.01.2023 13:40
    "возраст документа и его последнего обновления" - чем старше тем лучше или наоборот?
    С точки зрения машины, чем новее документ - тем он должен быть лучше, содержать более свежую и актуальную инфу. Хотя, надо учитывать специфику у статей и новостей.
    Ivan Feduleev   01.02.2023 09:26
    Из того, что удалось найти, чем старше, тем лучше. Вместо создания новых страниц, лучше вносить изменения в старый документ, обновлять его.
    qwerdie   31.01.2023 21:22
    это конечно збс... но при стаже от 3-х лет ничего нового... хочется лишь добавить "нюансы"... хотя надо смотреть код "слитого" там есть градации влияния от которых пересечения факторов на ++ можно узнать... хотя они очень очевидны после 2-х 3-х заходов на анализ даже новичку... скорее их чих-пых хуками можно назвать...

    если делаешь 4+ для людей на своем сайте то все эти факторы и приколы вообще не нужны... ты полюбому будешь Топ Топ-тать в кайф под любимы музон...
    что такое "4+ для людей"?
    К данной записи нельзя добавлять комментарии, т.к. она очень старая.
    Факторы ранжирования Google 2024 — исследование Semrush
    Накрутка поведенческих факторов — за и против
    Фильтры, санкции и алгоритмы Google