Продолжаем тему нового поиска от Яндекса. После презентации журналистам и блогерам удалось пообщаться с создателями "Королёва", мы тоже задали несколько вопросов. Публикуем основные мысли, прозвучавшие на пресс-подходе.
На вопросы отвечали:
Андрей Стыскин — руководитель направления поисковых продуктов
Ольга Мегорская — руководитель асессорской службы
Александр Сафронов — руководитель службы релевантности и лингвистики
Команда поиска Яндекса на презентации
Новый поиск — удобный поиск
Пользователи будут быстрее находить ответы на свои самые сложные запросы. Главная метрика качества поиска — вероятность нахождения ответа на странице выдачи по конкретному запросу. Эта метрика значительно растет.
Сложные запросы
На сложных, редких запросах проще всего заметить нововведения, потому что именно там важно понимать смысл запроса и составлять смысл документа. Таких запросов много, больше трети задаются всего один раз.
Пользователям бывает сложно сформулировать свою поисковую потребность. Они, например, не совсем знают, о каком объекте информацию они хотят получить, но знают какое-то его описание и пытаются найти ответ.
Такие запросы мы называем "длиннохвостовыми".
Запросы обрабатываются без участия людей?
Мы сейчас уже справляемся без помощи человека.
Когда вы задаете запрос в Яндексе, за триста миллисекунд ответ вам генерирует не человек. Сейчас у нас полностью машинный поиск, он на каждый запрос отвечает на лету.
Но данные для обучения, которые мы берем от людей, толокеров и асессоров, нет смысла выкидывать. Они отмечают эталонные выборки для разных технологий машинного обучения.
"фильм про космос где отец общался с дочерью через секундные стрелки" — это "Интерстеллар". Только никто его так не описывает.
Как толокеры узнают, что фильм из примера — это Интерстеллар? Кто-то смотрел этот фильм. Для обучения финальной формулы, где необходима разметка толокеров, задание выглядит следующим образом: задаем запрос, видим кандидатов, люди изучают материал, изучают суть запроса и суть документа. Если речь идет о фильме, они говорят, смотрели или не смотрели этот фильм, или отказываются от задания. И у нас на выходе получаются положительные и отрицательные примеры для обучения ранжированию.
Но "Королёв" использует всю пользовательскую статистику и умеет встроить отображение в смысл текста запроса, он этому обучен для всех пользовательских действий. Вы, когда задаете такой запрос и получаете правильный ответ, на него кликните. И мы используем этот сигнал, что такое описание запроса и такое описание из документа семантически одинаково. И тут благодаря большим данным получается такой супер-эффект. Речь о том, как мы используем язык для описания запросов и язык для написания документов. Мы находим семантически близкие вещи.
Также поисковик с 2012 года запоминает персональные предпочтения пользователей, их интересы учитываются.
Запросы на других языках
Яндекс работает в России, Беларуси, Казахстане, Украине и в Турции. В этих странах мы хорошо понимаем местную специфику: языки, смысл запросов. Сегодняшний релиз охватил все кириллические страны, где есть Яндекс. В остальных странах мы не оцениваем качество поиска, потому что у нас там нет пользователей.
Обрабатываются не только русскоязычные запросы, в России некоторые люди знают английский и делают запросы на нем. Асессоры обрабатывают запросы на английском тоже.
Доля Яндекса в рунете
Пока рано об этом говорить, к этому вопросу стоит вернуться в сентябре. Еще не все пользователи увидели окно выбора, вернулись с каникул и отпусков.
Что поисковик не умеет?
Сложно найти то, что он не умеет.
Пока у нас трудности с поиском информации, которой нет в интернете. Библиотеки, закрытые данные, соцсети, которые не дают данные для индексации. Но мы мечтаем, чтобы они открылись для индексации.
Как оптимизировать сайт под новый поиск
Чтобы сайт был выше в выдаче — нужно делать хороший сайт. По нашим данным, простые манипуляции с сайтами почти не помогают продвигаться. Делайте качественный контент, занимайтесь навигацией по сайту, оптимизируйте UX — это сильно влияет на позицию в выдаче. Именно это мы советуем всем вебмастерам.
Как разметка теперь влияет на место в выдаче
Если она вносит содержательный сигнал, то как влияла, так и будет влиять. Что касается поиска по картинкам, вся информация на странице важна, не только описание изображения. Но если нет другой информации, используется описание. Если есть другие источники информации, мы можем за их счет компенсировать незнание ключевых слов или отсутствие мета-описания. Всего в поиске больше 1000 сигналов для ранжирования.
Сервисы для определения позиций сайта по ключам и SEO-фирмы
Сегодня не тот день, когда нужно говорить про оптимизаторов и вебмастеров. Сегодня большой запуск, и он повлияет на решение задач наших пользователей. А смогут ли под это подстроиться оптимизаторы и владельцы seo-контор, и вообще, делают ли они полезное дело или продают воздух, — это сложно прокомментировать. Сегодня это в некотором смысле неважно.
Что делают толокеры и асессоры
Скорее всего, количество толокеров и асессоров не будет ни увеличиваться, ни уменьшаться. Мы сейчас в хорошей форме. Наши асессоры теперь делают более сложные задания. Например, мы активно тестируем интерфейсы с их помощью. Пока другие компании нанимают тестировщиков в штат, мы можем увеличить количество тестировщиков за счет асессоров, которые проверяют наши программы.
Как стать сотрудником Яндекса
Все асессоры устроены официально, мы постоянно приглашаем новых сотрудников. У нас работает больше десяти человек, которые вышли из асессоров и из толокеров. Это хороший способ попасть в Яндекс даже человеку, который не имеет какого-то специального бэкграунда. Сейчас в компании около 1400 асессоров.
Конкуренция с Google
Нам неизвестно, над чем работает Гугл. К сожалению, они не проводят такие запуски, они не такие открытые, как мы. Они не общаются так со своими пользователями и журналистами.
Могут ли спецслужбы купить у Яндекса алгоритмы для поиска "нежелательной" информации?
Сложно представить, как формально поставить и решить такую задачу, где взять положительные и отрицательные примеры. У нас нет к этому интереса, вряд ли это возможно.