Анализ контента pr-cy.ru наделен чувством юмора?

daz32 daz32  
9
  13.02.2011 08:30       1 080     Помощь  
http://pr-cy.ru/analysis_content...Ввожу http://wordshow.ru/ и наблюдаю контент: арнольдшекспир, рабиндранаттарантино, иммануилканделаки, эрнесточерномырдин, харукимэнсон, владимиртэтчер, паблоплатонпознер.

Весело, задорно. Имя склеивается с похожей фамилией. Вместо эрнесто че гевара - эрнесточерномырдин. Вместо кондолиза райс - кондолизарамазанова. Клеется не все.

Интересно было бы узнать о механизме сего феномена.

Ответы на пост (2) Написать ответ
webset webset
86
13.02.2011 09:21
Это ошибка сервиса. Взять например "паблоплатонпознер". Сервис понимает так, что запятая - отделяет фразу или предложение. На самом деле, на сайте сделано вот так:
Пикассо, Пабло
Платон
Познер, Владимир

Поэтому, сервис берет все, что находится между двумя запятыми (Между Пикссо и Владимир) и получается у нас вот что:
паблоплатонпознер

Элементарно, Ватсон =)
6
Решение
Jeck Jeck
101
13.02.2011 18:04
Про ошибку сервису это да - мой косяк. А вот причина немного другая, просто слова были разделены только тегами и в процессе обработки они удалялись, в результате слова склеивались. Исправил заодно сделал вывод всех слова а не только первой сотни.
2