Алгоритм Яндекса «Королёв» спустя полгода

14 февраля 2018

22 августа 2017 года Яндекс объявил о запуске нового алгоритма «Королёв», который якобы умеет находить ответ не только по словам, но и по смыслам. Как утверждает Яндекс, в основе алгоритма лежит нейронная сеть, которая использует для обучения поисковую статистику. SEO-сообщество со скепсисом отнеслось к новости, сойдясь во мнении, что пафосная презентация в планетарии с прямым включением с МКС – это маркетинговый хайп на модной теме, ориентированный на инвесторов. К тому же работает данный алгоритм преимущественно на информационных запросах, которые традиционно представляют для оптимизаторов меньший интерес по сравнению с коммерческими тематиками. А потому оптимизаторы расслабились и стали играть с уникальными поисковыми запросами, подлавливая Яндекс на некорректной работе «умного» алгоритма. 

Сравнение алгоритмов Королёв и Rankbrain

Но мы в лаборатории поиска Venta любую гипотезу проверяем фактами. Сейчас каждый второй школьник знает, что для любой нейросети критически важен объем накопленных данных. Чем дольше сеть обучается, тем она умнее. Поэтому мы решили дать «Королёву» шанс и подождали полгода, пока нейронная сетка как следует обучится угадывать фильмы по сумбурным описаниям киноманов. Мы выбрали не очень популярный, но достаточно известный фильм с уникальным сюжетом – «Бобро поржаловать», где действие происходит на севере Франции. Местные жители говорят на смешном диалекте, напоминающим в переводе наш суржик, а все их поведение и обычаи отмечены глубокой печатью провинциальности. На запрос [фильм про французов деревенщин на севере] в выдаче не нашлось релевантных ответов, там работает традиционный текстовый поиск, который считает, что нам интересны фильмы о французской деревне. Вертикальный поиск (картинки и видео) тоже оказался бессильным, а вот в блоке объектных ответов – стопроцентное попадание.

фильм про французов деревенщин на севере

Попробуем немного модицифировать запрос и изменим словоформы с предлогом [фильм о французах деревенщинах на севере]. При такой формулировке запроса нет даже объектного ответа. Если нейросеть такая умная, почему она не может переколдовать запрос по синонимичной словоформе? Не такая уж непосильная задача даже для обычного текстового поиска.

фильм о французах деревенщинах на севере

Как видим, даже незначительная текстовая модификация запроса в пределах словоформы способна пошатнуть уверенность нейронной сети. Попробуем задать запрос, используя сюжетное описание: [фильм где француз уехал на север к местным]. Тут уже поиску легче справиться с задачей, потому что во многих документах присутствуют слова запроса. Текстовый поиск неплохо справляется с задачей, объектный ответ верный, а вот вертикальный поиск – снова мимо. Причем в органической выдаче мы видим результат Кинопоиска, в котором не подсвечены слова запроса. Возможно, тут отрабатывает именно нейронная сеть, а не алгоритмы текстовой релевантности.

фильм где француз уехал на север к местным

Итак, спустя полгода после запуска «Королёва» можно сделать следующие выводы:

  1. Факторы текстовой релевантности по-прежнему остаются первичными, даже при поиске ответов на уникальные запросы, заданные на естественном языке.
  2. Если нейронные сети и работают, то в большей степени для формирования объектных ответов, нежели в органической поисковой выдаче.
  3. Вероятно, для больших информационных порталов типа Кинопоиска и Википедии алгоритм работает лучше благодаря их огромным массивам данных.

Похоже, мнения ведущих специалистов отрасли со временем подтвердились и бояться действительно нечего. Работа с семантикой и грамотная текстовая оптимизация по-прежнему остаются основой ранжирования.

Гагарин с укоризной взирает на Яндекс Королёв
p.s. Ну и напоследок - бонусный скриншот. Да, Юра, вместо твоей фотографии нам предлагают онлайн-знакомства)
Гагарин с телефоном - выдача Яндекса