Здравствуйте. Недавно я задавался вопросом, определяет ли Яндекс скан или нет. Походил по форумам, почитал. Пишут, что нет. В то время как раз обладал парой тематических сканеных книжек. Значит, закинул я все это дело в FineReader и решил проверить текст в следующих программах /сервисах:
1. E-txt антиплагиат (шингл 5) = 99 %
2. Advego = 100%
3.
content-watch.ru = 100%
И все же решил я проверить для пущей уверенности в text.ru и, о ужас, уникальность там была порядка 10%. Перейдя, на ту страницу, которую text.ru указал, как источник, всплыло предложение о загрузки некоего pdf файла. В том файле была как раз та часть книги, которую я проверял. Потом я пошел в сам яндекс, закинул в писковой запрос 40 символьную вырезку из того текста и он мне нашел как раз тот сайт с pdf документом. Поэтому предупреждаю тех, кто мб не знает об этом / не придавал значения - проверяйте скан на
text.ru
Я постоянный посетитель", "
постоянный посетитель сайта" и "посетитель сайта pr-cy". А при размере шингла 5 только
"Я постоянный посетитель сайта pr-cy"
Шингл с английского переводится как «чешуйка». В сфере SEO этим словом обозначают:
Кусочек текста в несколько слов (десятисловный шингл, четырехсловный шингл).Метод проверки текстов на степень похожести.Сам думал об этом.