Все посты
5127 1 Знания

Алгоритм Google RankBrain — что это и как он работает

Рассказываем, как появился первый известный алгоритм Google, работающий на машинном обучении, и какое влияние на SEO он имеет сейчас.

Google RankBrain — это алгоритм машинного обучения (ML), который помогает понимать поисковые запросы и предоставлять релевантные результаты.

Машинное обучение — это когда компьютер учится что-то делать сам. Алгоритм Google анализирует, как пользователи взаимодействуют с результатами поиска, и таким образом учится, чтобы улучшить будущие результаты выдачи.

Чем RankBrain отличается от других алгоритмов

Работа поисковой системы Google основывалась на алгоритме PageRank, который для определения важности сайта использовал ссылки и другие факторы, например, количество раз, когда слово появляется на странице.

Граф знаний, запущенный в 2012 году, позволил Google еще точнее распознавать связи между словами. Поисковик научился искать «вещи, а не строки».

«Строки» означают поиск только слов, которые встречаются в документе. «Вещи» — это человек, объект или явление, которые могут быть связаны с этими словами, но не обозначены прямым текстом в запросе.

Даже по непрямому запросу поиск может показать информацию о том, что ищет пользователь, и разные дополнительные факты. Например, блок графа знаний про Наполеона показывает информацию о его семье и предлагает ссылки на связанных с ним людей.

Пример карточки графа знаний
Граф знаний

Со временем поисковик совершенствовал алгоритмы и в 2013 году выпустил «Колибри» (Hummingbird), который мог учитывать интент запроса пользователя, то есть понимать, что человек хочет получить. Даже если документ не включал определенный набор ключевых слов, он все равно мог появиться в поиске из-за смысловой близости. Тем не менее, часто эти ключевые слова были совершенно новыми, так что Google не мог предложить на них ничего.

За год до выпуска, в 2014 году в блоге Google появился пост о том, как поисковик работает с машинным обучением:

Чтобы продвигать исследования о том, как машинное обучение может применяться к проблемам естественного языка, мы публикуем набор инструментов с открытым исходным кодом под названием word2vec , целью которого является изучение значения слов.
Word2vec использует распределенные представления текста, чтобы выявить сходство между понятиями. Например, он понимает, что Париж и Франция связаны так же, как Берлин и Германия (столица и страна), а не так, как Мадрид и Италия. Эта диаграмма показывает, насколько хорошо он может усвоить концепцию столиц, просто прочитав множество новостных статей – без присмотра человека.
Модель не только размещает похожие страны рядом друг с другом, но и размещает их столицы параллельно. Самое интересное, что мы не предоставляли никакой контролируемой информации ни до, ни во время обучения. Многие другие подобные паттерны возникают автоматически в процессе обучения.
Связь между странами и столицами, установленные с помощью ML
Связи между странами и их столицами, которые установил алгоритм

Некоторые оптимизаторы считают, что Word2vec лежит в основе RankBrain. Даже если в действительности это не так, по постам и анонсам поисковика можно понять вектор развития алгоритмов.

В RankBrain, вышедший в 2015 году, добавили еще один уровень интерпретации. Он пытается распознать цель поискового запроса, даже если запрос неоднозначен или ранее не встречался. В каком-то смысле его можно считать следующей ступенью развития «Колибри».

Вначале алгоритм применяли к запросам, с которыми Google ранее не сталкивался и которые составляли тогда около 15% всех поисковых запросов. Со временем его стали использовать для всех результатов поиска.

Пословам сотрудников поисковика, RankBrain — не самостоятельная сущность, а один из множества сигналов, по которым Google определяет, какие результаты появляются на странице поиска. В 2016 году двумя другими основными сигналами были качество контента и ссылки, но к 2024 году вряд ли что-то сильно поменялось.

Как работает RankBrain

У RankBrain две основные задачи:

1. Понимание поисковых запросов пользователя и ключевых слов на страницах;

2. Измерение удовлетворенности пользователей этими результатами.

В зависимости от запроса RankBrain увеличивает или уменьшает значимость бэклинков, новизны и длины контента, авторитетности домена и других факторов.

Затем он смотрит на то, как пользователи Google взаимодействуют с новыми результатами поиска. Если пользователям больше нравятся новые результаты, алгоритм продолжит подбирать для показа страницы таким образом, если нет — возвращается к старому способу подбора результатов.

До RankBrain 100% алгоритмов Google регулировали вручную. Несмотря на то что инженеры все еще работают над алгоритмом, RankBrain в основном самостоятельно настраивает свою работу. Как это происходит:

  1. Алгоритм получает запрос и находит по нему результаты;

  2. Получает другой запрос, который незначительно отличается от предыдущего — например, в запросе о событии слова «дата и время» заменены на «когда»;

  3. Понимает, что результаты могут быть идентичными, очень похожими или, по крайней мере, взятыми из одного и того же списка URL-адресов.

  4. Показывает результат пользователю.

Чтобы обучить алгоритм, инженеры Google сначала «скармливали» ему данные из разных источников, чтобы он начал сопоставлять разные сигналы с разными результатами и упорядочивать выдачу на основе этих вычислений.

Предположим, что вы ищете «айфон с тремя камерами темно-зеленый». Google будет искать страницы, содержащие термины «айфон», «три камеры», «темно-зеленый». В ответ на запрос поисковик показывает конкретную модель телефона:

Выдача по непрямому запросу
Пример выдачи по непрямому запросу

RankBrain также учитывает контекст окружающей среды — устройство, местоположение пользователя, дату и время, когда он делает запрос.

Какие сигналы учитывает RankBrain?

Чтобы оценить, насколько результат выдачи соответствует запросу пользователя, алгоритм должен использовать какие-то маркеры релевантности страницы и качества сайта.

Исходя из всего, что известно об этом алгоритме и его предшественниках, можно предположить, что сигналы такие:

Данные о поведении пользователей для оценки удовлетворенности результатом

  • Кликабельность сниппета (CTR) — так алгоритм отбирает страницы, которые заинтересовали пользователей.

  • Время на сайте.

  • Показатель отказов.

Релевантность контента

RankBrain оценивает релевантность контента на странице. Речь идет не только о сопоставлении ключевых слов, но и о глубоком понимании контекста. Он может различать фрагменты, которые затрагивают разные аспекты и подтемы, связанные с основной темой. Кроме того, контент должен показывать, что автор разбирается в теме. Поверхностные ответы на сложные поисковую систему не устроят.

Сигналы качества страницы

  • Ссылочный профиль.

  • Авторитетность домена.

  • Свежесть и актуальность контента.

Технические факторы

  • Скорость загрузки страницы: насколько быстро загружается веб-страница.

  • Удобство для мобильных устройств: насколько хорошо страница работает и отображается на мобильных устройствах.

  • Безопасный и доступный веб-сайт: использование HTTPS и легкость, с которой поисковые системы могут сканировать страницу.

История поиска

RankBrain также может учитывать предыдущие поисковые запросы пользователя, чтобы лучше понять контекст и цель текущего запроса.

Местоположение и персонализация 

Географическое местоположение пользователя и любые настройки персонализации, которые он может иметь, могут влиять на результаты.

Что в 2019 году говорил об этом Гарри Илш на Реддите:

RankBrain — это компонент ранжирования на основе машинного обучения, который использует исторические данные поиска, чтобы предсказать, на что с наибольшей вероятностью нажмет пользователь по ранее невиданному запросу. Это действительно крутая инженерная разработка, которая спасала наши задницы бесчисленное количество раз, когда традиционные алгоритмы говорили: «О, посмотрите на «нет» в строке запроса! Давайте проигнорируем это!», но обычно он просто полагается на данные (иногда) месячной давности о том, что произошло на самой странице результатов, а не на целевой странице сайта. Время задержки, CTR, какой бы ни была новая теория Фишкина (Рэнд Фишкин, основатель сервиса Moz — прим. ред.), это вообще чушь выдуманная. Поиск гораздо проще, чем думают люди.

Правда, в 2023 году все-таки стало известно, что Google учитывает пользовательские сигналы, так что пусть и не в контексте RankBrain, но они важны.

Что важно для SEO

Однозначных рекомендаций от Google именно для RankBrain, разумеется, нет. Хотя бы по той причине, что одновременно работает множество алгоритмов и систем оценки контента. В отличие от старого поиска, который искал семантическое соответствие, RankBrain — это модель интерпретации запросов, так что придется сделать упор на детализированность и глубину контента — впрочем, об этом поисковик говорит уже много лет безотносительно конкретных алгоритмов.

Тем не менее можно дать несколько рекомендаций. Их не нужно воспринимать буквально, но они могут помочь понять, как Google анализирует документы и формирует выдачу.

Наполняйте страницы смыслом, а не ключевыми словами

Возможно, вы уже устали читать про сигналы E-E-A-T, но в этом есть смысл. Чем более полезный и исчерпывающий ответ вы дадите на своих страницах, тем лучше будут пользовательские сигналы и выше оценка контента от поискового робота.

Создавайте тематические кластеры страниц

Оптимизировать одну страницу под все запросы, касающиеся какой-то темы, невозможно и не нужно. Создавайте тематические кластеры. Например, основная страница будет рассказывать о продажах на маркетплейсах в целом, а другие связанные с ней — о продвижении на конкретных маркетплейсах и о других важных вещах, например, о работе с отзывами.

Поисковый робот обнаружит внутреннюю перелинковку между страницами, что послужит сигналом релевантности вашего контента.

Оптимизируйте страницы под ключи средней длины

Это выглядит как базис запроса и пара слов для уточнения. Такие ключи обеспечивают баланс между большим охватом коротких ключей и специфичностью «длинных хвостов». Как правило, они достаточно конкретны, чтобы указать на намерение пользователя, и в то же время достаточно широки, чтобы охватить различные связанные запросы.

Например, запрос «блины на молоке рецепт» имеет меньший охват, чем запрос «блины рецепт», но соберет гораздо больше трафика, чем запрос «тонкие блины на молоке без сахара рецепт».

В то же время при оптимизации страницы под «средний» запрос у вас есть возможность добавить релевантную информацию, которая приведет в том числе и пользователей, ищущих «длинные хвосты». В любом случае важнее проработанность контента.

Не концентрируйтесь на «длинных хвостах»

Ключевые слова с длинным хвостом, которые веб-мастеры любят за их специфичность и низкую конкуренцию, стали менее актуальными. Основная задача RankBrain — понимание намерений. Даже если пользователь не уточняет запрос детально, Google все равно может распознать интент и предоставить релевантные результаты. Суперточные запросы на 5-6 слов просто принесут меньше трафика. Разумеется, это не касается специфических тем, по которым в принципе мало информации, и коммерческих запросов, где пользователь ищет конкретный продукт, вводя его название полностью.

Оптимизируйте для естественного языка

Естественный язык – это способ общения людей в повседневной речи или письме. RankBrain использует обработку естественного языка (NLP), чтобы понять значение и контекст пользовательских запросов, особенно тех, которые длинные, сложные или разговорные. Пишите простым языком, соответствующим тону и словарному запасу вашей аудитории. Не забывайте включать в тексты синонимы, варианты написания и связанные термины.

Оптимизируйте под голосовой поиск

Этот пункт прямо связан с двумя предыдущими.

Голосовой поиск быстрее и проще, чем ввод текста, его можно выполнять на разных устройствах — ноутбуках, смартфонах, умных колонках.

Чтобы оптимизировать контент для голосового поиска, нужно структурировать его так, чтобы отвечать на конкретные вопросы, которые пользователи могут задать, используя естественный язык.

Например, чтобы получить трафик по запросу «какие блюда попробовать в [название ресторана] в 2024 году» с помощью голосового поиска, страница должна содержать прямой ответ. Используйте короткие предложения и подзаголовки, перечислите лучшие блюда и их описания.

Рост популярности голосового поиска и разговорных запросов означает, что пользователи с меньшей вероятностью будут вводить длинные конкретные фразы, они скорее будут задавать короткие вопросы.

Разумеется, голосовой поиск подходит не для всех типов запросов, а пользуются им в основном с мобильных устройств, так что ориентируйтесь на тип контента и потребности аудитории.

Оптимизируйте под расширенные результаты

Пользователи ленятся переходить на сайты, если их вопросы не подразумевают глубокого погружения в тему. Поисковые системы выдают быстрые ответы и другие типы расширенных результатов, по которым пользователи охотно кликают, если видят, что в спецблоке выдачи именно то, что им нужно.

Нужно организовать свой контент так, чтобы Google мог легко извлекать и отображать соответствующую информацию для этих функций. Используйте заголовки, списки, таблицы, изображения и видео, чтобы подчеркнуть ключевые моменты страницы. Чтобы упростить роботам поиск вашего контента, используйте микроразметку.

Две большие статьи по теме:
Как попасть в блок с быстрыми ответами Google
Расширенный сниппет в Google — что это и как сделать

Следите за репутацией домена

Репутация домена зависит от разных факторов: публикация качественного контента, ссылочная масса, вовлеченность пользователей. Чем авторитетнее домен, тем больше вероятность, что поисковый алгоритм будет показывать его в выдаче.

В итоге

К сожалению, не существует единого чек-листа, после прохождения которого сайт гарантированно будет занимать высокие позиции в выдаче и получать трафик. Есть только немного информации от самих поисковых систем и коллективный опыт оптимизаторов, которые позволяют предположить, как делать правильно, чтобы добиться нужного результата. Мы постарались объяснить, как работает один из основных алгоритмов Google, чтобы вы учитывали это в планировании своей SEO-стратегии, но для продвижения важны все аспекты — и технические вроде скорости загрузки, и контент, и ссылочная масса, и юзабилити. Все это нужно учитывать в равной степени и всегда ориентироваться на успешных конкурентов.

Возьмите под контроль продвижение своего сайта
Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.
🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.

Теги поста или какие разделы почитать еще:

Комментарии (1)
Anman   03.04.2024 13:12
Спасибо за отличную статью!
К данной записи нельзя добавлять комментарии, т.к. она очень старая.
Фильтры, санкции и алгоритмы Google
Что такое Google Gemini и как ее использовать
Google AI Overviews: как ИИ повлияет на поисковую выдачу и работу оптимизаторов