Все посты
5608 5 Мнения

Новый поиск Яндекса: интервью с создателями

Удобные и неудобные вопросы сотрудникам Яндекса.

Продолжаем тему нового поиска от Яндекса. После презентации журналистам и блогерам удалось пообщаться с создателями "Королёва", мы тоже задали несколько вопросов. Публикуем основные мысли, прозвучавшие на пресс-подходе.

На вопросы отвечали:

Андрей Стыскин — руководитель направления поисковых продуктов

Ольга Мегорская — руководитель асессорской службы

Александр Сафронов — руководитель службы релевантности и лингвистики



Команда поиска Яндекса на презентации


Новый поиск — удобный поиск

Пользователи будут быстрее находить ответы на свои самые сложные запросы. Главная метрика качества поиска — вероятность нахождения ответа на странице выдачи по конкретному запросу. Эта метрика значительно растет.


Сложные запросы

На сложных, редких запросах проще всего заметить нововведения, потому что именно там важно понимать смысл запроса и составлять смысл документа. Таких запросов много, больше трети задаются всего один раз.

Пользователям бывает сложно сформулировать свою поисковую потребность. Они, например, не совсем знают, о каком объекте информацию они хотят получить, но знают какое-то его описание и пытаются найти ответ.

Такие запросы мы называем "длиннохвостовыми".


Запросы обрабатываются без участия людей?

Мы сейчас уже справляемся без помощи человека.

Когда вы задаете запрос в Яндексе, за триста миллисекунд ответ вам генерирует не человек. Сейчас у нас полностью машинный поиск, он на каждый запрос отвечает на лету.

Но данные для обучения, которые мы берем от людей, толокеров и асессоров, нет смысла выкидывать. Они отмечают эталонные выборки для разных технологий машинного обучения.


"фильм про космос где отец общался с дочерью через секундные стрелки" — это "Интерстеллар". Только никто его так не описывает.


Как толокеры узнают, что фильм из примера — это Интерстеллар? Кто-то смотрел этот фильм. Для обучения финальной формулы, где необходима разметка толокеров, задание выглядит следующим образом: задаем запрос, видим кандидатов, люди изучают материал, изучают суть запроса и суть документа. Если речь идет о фильме, они говорят, смотрели или не смотрели этот фильм, или отказываются от задания. И у нас на выходе получаются положительные и отрицательные примеры для обучения ранжированию.

Но "Королёв" использует всю пользовательскую статистику и умеет встроить отображение в смысл текста запроса, он этому обучен для всех пользовательских действий. Вы, когда задаете такой запрос и получаете правильный ответ, на него кликните. И мы используем этот сигнал, что такое описание запроса и такое описание из документа семантически одинаково. И тут благодаря большим данным получается такой супер-эффект. Речь о том, как мы используем язык для описания запросов и язык для написания документов. Мы находим семантически близкие вещи.

Также поисковик с 2012 года запоминает персональные предпочтения пользователей, их интересы учитываются.


Запросы на других языках

Яндекс работает в России, Беларуси, Казахстане, Украине и в Турции. В этих странах мы хорошо понимаем местную специфику: языки, смысл запросов. Сегодняшний релиз охватил все кириллические страны, где есть Яндекс. В остальных странах мы не оцениваем качество поиска, потому что у нас там нет пользователей.

Обрабатываются не только русскоязычные запросы, в России некоторые люди знают английский и делают запросы на нем. Асессоры обрабатывают запросы на английском тоже.


Доля Яндекса в рунете

Пока рано об этом говорить, к этому вопросу стоит вернуться в сентябре. Еще не все пользователи увидели окно выбора, вернулись с каникул и отпусков.


Что поисковик не умеет?

Сложно найти то, что он не умеет.

Пока у нас трудности с поиском информации, которой нет в интернете. Библиотеки, закрытые данные, соцсети, которые не дают данные для индексации. Но мы мечтаем, чтобы они открылись для индексации.


Как оптимизировать сайт под новый поиск

Чтобы сайт был выше в выдаче — нужно делать хороший сайт. По нашим данным, простые манипуляции с сайтами почти не помогают продвигаться. Делайте качественный контент, занимайтесь навигацией по сайту, оптимизируйте UX — это сильно влияет на позицию в выдаче. Именно это мы советуем всем вебмастерам.


Как разметка теперь влияет на место в выдаче

Если она вносит содержательный сигнал, то как влияла, так и будет влиять. Что касается поиска по картинкам, вся информация на странице важна, не только описание изображения. Но если нет другой информации, используется описание. Если есть другие источники информации, мы можем за их счет компенсировать незнание ключевых слов или отсутствие мета-описания. Всего в поиске больше 1000 сигналов для ранжирования.


Сервисы для определения позиций сайта по ключам и SEO-фирмы

Сегодня не тот день, когда нужно говорить про оптимизаторов и вебмастеров. Сегодня большой запуск, и он повлияет на решение задач наших пользователей. А смогут ли под это подстроиться оптимизаторы и владельцы seo-контор, и вообще, делают ли они полезное дело или продают воздух, — это сложно прокомментировать. Сегодня это в некотором смысле неважно.


Что делают толокеры и асессоры

Скорее всего, количество толокеров и асессоров не будет ни увеличиваться, ни уменьшаться. Мы сейчас в хорошей форме. Наши асессоры теперь делают более сложные задания. Например, мы активно тестируем интерфейсы с их помощью. Пока другие компании нанимают тестировщиков в штат, мы можем увеличить количество тестировщиков за счет асессоров, которые проверяют наши программы.


Как стать сотрудником Яндекса

Все асессоры устроены официально, мы постоянно приглашаем новых сотрудников. У нас работает больше десяти человек, которые вышли из асессоров и из толокеров. Это хороший способ попасть в Яндекс даже человеку, который не имеет какого-то специального бэкграунда. Сейчас в компании около 1400 асессоров.


Конкуренция с Google

Нам неизвестно, над чем работает Гугл. К сожалению, они не проводят такие запуски, они не такие открытые, как мы. Они не общаются так со своими пользователями и журналистами.


Могут ли спецслужбы купить у Яндекса алгоритмы для поиска "нежелательной" информации?

Сложно представить, как формально поставить и решить такую задачу, где взять положительные и отрицательные примеры. У нас нет к этому интереса, вряд ли это возможно.

Возьмите под контроль продвижение своего сайта
Исправьте ошибки, которые мешают сайту выйти в топ, и вы увидите рост трафика и дохода.
🔍 Подпишись на @prcynews в телеграм — оставайся в курсе последних SEO новостей и свежих материалов.
Комментарии (5)
melianora   23.08.2017 18:11
вода.
melianora   23.08.2017 18:15
По сути - первая страница поиска коммерческого запроса на видимость экрана забита директом. с 5 позиции уже можно что-то наблюдать толковое из поиска. На откуп вебмастерам отдали микрочастотники и ультра мч. Затраты вырастут на написание статей во много раз. молодому сайту продвинуться будет проще, но и сложнее в тоже самое время. Первый трафик пойдет раньше, но статей потребуется больше. Комм запросы так же прихватизировал яша себе под директ. Информационные сайты доход существенно потеряют в ближайший месяц..
Inna_S   24.08.2017 06:24
За что купили, за то и продаем.
Но с вашим комментарием ниже согласна.
Nakamoto   24.08.2017 12:55
Яндекс — коммерческий проект. Он никогда не работал, не работает и не будет работать для пользователей Интернета. Ему нужно сгрести бабло с лохов и свято верящих в необходимость Яндекса. Это, так называемый поисковик, тупо ставит всех мнительных в стойло и зарабатывает на них бабки. Попробуйте вообще отказаться от сервисов Яндекса и вы увидите, как легко станет вам жить, как не просядет трафик, как останутся деньги при вас, а не в безразмерном брюхе Яндекса.
Вам нужна аналитика? Пользуйтесь независимыми сервисами, которые не принесут вреда вашим проектам и не опустошат ваши карманы. Это же так просто...
Avtostopshik   24.08.2017 23:19
Что гугл, что яндекс, что мы с вами, работаем ради одного - денег. Все хотят денег, и какую бы мы работу не делали в интернете, вся она нацелена на одно - получение прибыли. Так что не надо хаять яндекс за то, что он хочет заработать денег - мы все в этом погрязли.
К данной записи нельзя добавлять комментарии, т.к. она очень старая.
Подборка сервисов для расшифровки аудио в текст
🍕 Юзабилити сайта — что это такое, примеры, самостоятельный анализ
Фильтры, санкции и алгоритмы Яндекса