Скан

Todd71 Todd71   15.09.2012 00:36   444  
народ. мне в руки попал архив со сканом, текст такой в инете есть  уже проиндексирован  - тиц у того ресурса 4к+, но есть один ньюанс -  текст  скана на том ресурсе не был  почищен от  машинного мусора. Стоит ли  использовать этот скан  у себя на сайте (тематика косвенно совпадает)  предварительно вручную почистив его от мусора?  Почистив от мусора я думаю  получится  50% отличие текста от  того что  уже заиндексирован с  машинным мусором.

И еще вопрос: если в источнике сканирования не написано  что запрещено  копирование. перепечатывание  и распространение  материалов  из источника,  то сильно ли нарушается закон? хDD  Вроде в энциклопедиях тоже нет такой надписи...

Ответы на вопрос (5) Написать ответ
Todd71 Todd71   15.09.2012 00:39
и еще, я вроде слышал что яндекс распознает текст в формате pdf
0
74ivan74 74ivan74   15.09.2012 00:42
в энциклопедиях есть такая надпись, чистите и распределяйте постатейно а не как обычно, все книгу одной статьей в случае скана обычно так делают
0
Todd71 Todd71   15.09.2012 00:49
да мне не нужна целиком книга) там некоторые главы очень подходят мне по тематике и написаны они в таком виде как нада) вот мне интересно там примерно на 20 статей по 1.5к знаков - стоит ли их добавлять? просто подозрение что сайт под фильтром и хотел добавить еще немного уника и подчистить сайт прежде чем писать платонам
0
Todd71 Todd71   15.09.2012 00:53
ну а насчет "в энциклопедиях есть такая надпись" сейчас просмотрел 8 энциклопедий разного типа и не нашел этой надписи, только знак ©, а вот в книге самоучителе по PHP есть такая надпись"Все права защищены. Любая часто этой книги не может ыть воспроизведена в какой то ни было форма и какими бы то ни было средствами без письменного разрешения владельца авторских прав."
0
Todd71 Todd71   15.09.2012 00:55
прошу прощения за опечатки - пальцы печатают в обход мозга хDD
0

Войдите, чтобы написать ответ
Вход Регистрация