Лидер рынка поисковых систем Рунета запустил новый поисковый алгоритм, который использует ресурсы искусственных нейронных сетей. В блоге Яндекса говорится, что целью нововведений выступает повышение релевантности выдачи при формировании ответов на редкие запросы.
Алгоритм получил название Па́лех в честь города, который знаменит уникальной техникой лаковой росписи. Разработчикам Яндекса приглянулась одна из палехских миниатюр, изображающая сказочную Жар-птицу и напоминающую график частотного распределения запросов.
Визуальные представления этого графика в Яндексе также часто принимают форму птицы, маленький клюв которой соответствует высокочастотным запросам, а туловище и длинный хвост – СЧ- и НЧ-запросам, соответственно.
Список ВЧ запросов не особо велик, но пользователи задают их чрезвычайно часто. В то же время ключевые фразы, применяемые в низкочастотных запросах, встречаются очень редко и являются очень сложными. Тем не менее, в совокупности на их долю приходится серьезный объем трафика (около 100 млн. запросов в день при совокупном количестве запросов всех типов на уровне в 280 млн. в день). Как следствие, НЧ запросы олицетворяют "длинный хвост" Жар-птицы.
Чтобы точнее понимать НЧ-запросы пользователей с точки зрения как ключевых слов, так и смысла, Яндекс собирается использовать поисковую модель на основе искусственных нейронных сетей. Это очень пригодится в ситуациях, когда на имеющихся в индексе поисковика страницах с релевантным контентом не встречаются ключевые слова из НЧ запроса.
При подготовке поискового алгоритма Палех специалисты компании использовали систему так называемых "семантических векторов", позволяющую формировать ответы на сложные запросы, по которым у Яндекса очень мало пользовательской статистики.
В блоге компании также отмечается, что конечной целью использования искусственных нейронных сетей для Яндекса является создание алгоритмов, способных понимать запросы пользователей на уровне, который сравним с уровнем человека.