«Поиск по архивам» содержит каталог 2,5 млн страниц документов с середины XVIII до начала XX века. Сервис предназначен для историков, социологов, демографов, а также всем людям, кто интересуется своей родословной.
Для поиска доступен фильтр по годам, архивам, фондам, описям. С его помощью можно найти документ определенного типа в конкретном населенном пункте. Нейросеть определяет символы с помощью системы оптического распознавания, понимает тонкости почерка, знает старые буквы и контекст документов.
Алгоритм обучался на массиве из сотен тысяч реальных документов XVIII-XIX веков. Затем программа автоматически генерировала аналогичные тексты на ее основе, чтобы алгоритм продолжал обучаться с их помощью. Качество расшифровки материалов устанавливали эксперты.
Со временем число отсканированных и доступных документов будет расти.