Если ситуация неоднозначная и тем (исходя из слов много), поисковик рассчитывает вероятность того, что та или иная тема является доминирующей по определенной формуле. И исходя из этого показывает словосочетание в том или ином контексте. Дальше я смотреть не буду, ибо на практике эта хрень мало поможет, мне кажется.
Я послушала первые 4 минуты. У меня вроде по высшей математике было "отлично" и матрицы мы легко решали... Но что хочет донести этот дядя, я не поняла.
Я поняла общую мысль на 11 минуте, но наверное до конца я смотреть не буду, ибо удавишься. Человек не умеет объяснять. Как я понимаю, есть частота слов текста. Допустим, "налог" - 5, "риск" -7 и т.д. и т.п. Из этих частот составляется матрица. Например 579 -первый столбец, 693 - второй столбец и т.д. И вот этот дядя заумно пытается объяснить, что можно сделать с этой матрицей, чтобы алгоритм ранжировал ваш текст по запросам выше... НО как он это объясняет - это жутковато...
А еще он говорит о том, что одни и те же словосочетания могут иметь разные смысловые значения. Например, круглый стол по юридическим вопросам. Поисковик может найти данный текст по запросу "круглый стол" - и показать текст тем, кто ищет мебель, а автору текста надо, чтобы человек находил данный текст по запросу о мероприятиях по праву. И поисковик в целом ориентируется на то, к какой теме в целом относятся эти сочетания. Если остальные словосочетания относятся к теме по праву, поисковик будет правильно показывать вашу страницу, если поисковик при квалификации запутается - то может показать и вашу страницу в запросе о мебели. Это смысл до 24 минуты... И он там темы разными красками разрисовывает.