Подскажите есть ли скрипт или софт для поиска дублей ?
Есть текстовый документ, в нем находятся стихи, каждый стих идет с новой строки, вот примерно так:
Достигли мы своей вершины, в стране загадочных скриптов,
И интернет своей любовью обнял нас индексом с тобой.
Но дядя Яша, злой наш гений, решил урок нам преподать,
И стал веб-мастерам упрямо, свои он правила пихать.
***
Терпел тирана наш веб-мастер, а дяде Яше наплевать,
Задумал он в свой индекс грешный, партнеров сайты размещать.
Один каталог дяди Яши вселят в нас земной покой,
Жаль регистрация бесплатна, там не доступна нам с тобой.
***
....
и так далее ...
Так вот нужен софт или скрипт который поможет искать и удалять одинаковые стихи (дубли) автоматически или полуавтоматически, короче говоря упростить работу.
Количество стихов более 10000 так что ручками делать такую работу не предлагайте.
Да, он может находить, заменять, удалять, но мне нужно что бы программа сама нашла все дубли и удалила, а тут получается надо указывать например одну строку или слово, и тогда идет поиск дублирования этой строки или слова, это тоже не то что нужно. Спасибо за помощь.
Каждую отдельную запись помещаю в отдельную ячейку столбца, потом - Данные - Удалить дубликаты.