41039 Знания

Подборка сервисов для расшифровки аудио в текст

Обновленная подборка сервисов, которые бесплатно расшифруют речь в текст — записи интервью, голосовые сообщения и озвучку видео. Будет полезно копирайтерам и журналистам.

Использовать голосовой набор не всегда удобно, если это не запросы в поисковики. В шумной обстановке не получается прослушать запись голосового сообщения, некоторые люди в принципе лишены такой возможности. Если надиктованная информация нужна в печатном виде, войсы приходится переслушивать и перепечатывать, это тратит время и силы. Расшифровать интервью и аудиодорожку к видео тоже хорошо бы не собственными руками. 

Зачем может понадобиться конвертировать аудио в текст

  1. Расшифровать запись длинного интервью или подкаста.
  2. Сделать транскрибацию озвучки видео.
  3. Надиктовать себе идей, пока есть вдохновение.
  4. Понять, о чем говорят в голосовом сообщении, когда нет возможности послушать.
  5. Общаться с людьми с особенностями слуха.

Для помощи в расшифровке аудио в текст есть сервисы. Мы составили список из программ и ботов в социальных сетях, их существует больше, но мы выбрали самые удачные. Некоторые работают с русскими, некоторые с иностранными текстами. Всеми сервисами из подборки можно пользоваться бесплатно, но в некоторых нужно будет зарегистрироваться.

Сервисы для перевода речи в текст

Блокнот для речевого ввода

Возможности: перевод диктуемых слов в текст, транскрибирование речи из аудио и видео с Ютуба.

Сервис автоматически расшифровывает произносимые слова по ходу надиктовки, причем умеет распознавать знаки препинания, если отметить пункт «Заменять слова пунктуации». Мы надиктовали ему «Привет восклицательный знак мы тестируем запятая как справляется сервис с расшифровкой текста точка» и так далее, самые часто употребляемые знаки он распознал, но не справился с многоточием, тире, скобками и кавычками.

Сервис для расшифровки аудио в текст
Тест сервиса на знаки препинания

Транскрибирование текстов из загруженных аудиозаписей и из видео с Ютуба происходит в реальном времени при воспроизведении. Загружаем файл в сервис или указываем ID видео (символы после https://www.youtube.com/watch?v=), нажимаем «Включить запись».

Расшифровка аудиодорожки в текст
Сервис транскрибирует речь ведущего

Бесплатно сервис работает с транскрибированием онлайн без ограничений, а также с распознаванием голоса на аудио и видео не дольше 15 минут.

Сервис не идеальный, но работает бесплатно, прост в управлении и не требует регистрации. Результат расшифровки может быть довольно чистым — всё зависит от дикции и скорости речи. Лишний повод потренироваться, если диктуете для себя, но нужно привыкнуть называть знаки препинания, если не хочется расставлять их потом.

Инструмент полезен, когда нужно надиктовать себе материал для текста или в заметку, расшифровать подкаст или интервью. Его можно включить фоном в процессе интервью, чтобы сервис расшифровывал речь в реальном времени.

Расширение «Голосовой ввод текста» для Google Chrome

Возможности: диктовка текста в соцсетях, строке поиска и на сайтах. Диктовка в приложениях Windows,Linux и Mac.

От сервиса «Голосовой блокнот» есть браузерное расширение для переписки в соцсетях и речевого ввода текста на сайтах, а еще дополнительный модуль для использования в приложениях Windows.

Расширение для соцсетей и форумов

Расширение умеет переводить голос в текст: можно диктовать поисковые запросы, сообщения в социальных сетях и на форумах.

Попробуем надиктовать сообщение в ВКонтакте. Открываем диалог, кликаем правой кнопкой мыши и выбираем расширение.

Расширение для перевода речи в текст
Выбор расширения по клику правой кнопкой

Ввод подсвечивается красным, в браузере появляется окно разрешения доступа к микрофону. Разрешаем доступ, диктуем сообщение, называя знаки препинания: «Настя запятая привет восклицательный знак как твои дела вопросительный знак», готовый текст отображается в поле ввода.

Распознавание голосового сообщения
Готовый текст сообщения


Сложно привыкнуть диктовать знаки препинания, на их озвучивание уходит много времени, но зато не нужно расставлять запятые вручную.

Результат расшифровки зависит от дикции говорящего, но в целом расширение для ввода хорошо справляется.

Расшифровка в любых приложениях Windows, Linux и Mac

Дополнительный бесплатный модуль для интеграции открывает тестовый период режима, который позволяет вводить текст напрямую в любые браузеры и приложения Windows: Word, Excel, Google Docs и другие — в любые места, где используется клавиатура. Для этого нужно зарегистрироваться в Голосовом блокноте и установить модуль.

Как установить модуль интеграции Голосового блокнота:

После установки модуля нужно зайти в личный кабинет и включить тестовый период:

Как работать в блокноте для речевого ввода
Личный кабинет в сервисе

Если все прошло успешно, в блокноте у пункта Интеграция с OS появится срок действия тестового периода.

Как работать в сервисе Голосовой блокнот
Даты тестового периода

Попробуем надиктовать текст, например, в Word:

  1. Заходим на сайт голосового блокнота, включаем запись.
  2. Открываем документ в Word и начинаем диктовать.
  3. С задержкой в пару секунд текст появляется на экране.
Транскрибация речи в текст в Word


Текст получилось надиктовать в Google Docs, Блокнот и почту Gmail:

Диктовка письма в Gmail



Чистота расшифровки зависит от дикции, громкости и скорости речи, после диктовки скорее всего придется внести несколько правок в окончаниях и заглавных буквах.

Тестовый период длится всего три дня, его хватит, чтобы понять, нужен ли вам сервис. Плата небольшая: 100 рублей за месяц, 250 за три или 800 за год использования расширенных возможностей.

Dictation.io

Возможности: расшифровка живой речи, подкастов и озвучки видео в текст в реальном времени.

Сервис Dictation заявлен как мультиязычный, он может распознавать речь на более 100 языках. Он использует движок распознавания речи Google.

Регистрация не нужна, сервис работает бесплатно. Он похож на Голосовой блокнот: нужно кликнуть на включение распознавания, надиктовать что-то самому, включить подкаст или видео с речью, а сервис в реальном времени будет слушать и распознавать текст.

С живой диктовкой он справился довольно хорошо, распознал голосовое обозначение знаков препинания «точка», «запятая».

Расшифровка диктовки специально для сервиса

Расшифровка подкаста «Это реальная история — Дело об исчезновении Кристофа Сиона» получилась не очень чистой, хотя ведущая говорила внятно. Видимо, дело в скорости речи.

Как расшифровать подкаст автоматически
Расшифровка подкаста



С транскрибированием ролика «Regional German Dialects» на канале Easy German сервис справился отлично. Ведущая с хорошей дикцией говорила в обычном не быстром темпе.

Транскрибация видео онлайн
Расшифровка речи из видео

В любом случае, если человек не диктует специально для сервиса, называя знаки препинания, придется править текст. Чистота расшифровки зависит от скорости аудиодорожки, с внятной медленной речью он справляется отлично.

Dragon Dictation

Возможности: расшифровка надиктованных предложений в текст.

Программа для iOS, работает онлайн через iTunes Store. Удобно использовать на мобильном, чтобы надиктовывать на ходу замечания или идеи к новым статьям.

Сервис для расшифровки голоса в текст
Расшифровка речи


Программа работает бесплатно, но только на iOS.

Otter

Возможности: распознавание англоязычной речи в записи или на диктовке с возможностью идентифицировать собеседников.

Сервис для распознавания речи и расшифровки аудио или видео. Работает только с английским языком. Если не пропустить первые шаги настройки и прочитать сервису текст на экране, он запомнит ваш голос. Это позволит ему отделять ваши реплики от чужих в записях с несколькими собеседниками.

Бот для расшифровки речи
Прочитайте это сообщение, чтобы бот вас запомнил

Англоязычный сервис для расшифровки голоса
Сервис транскрибировал фразу на английском


Фразу «расшифруй что-нибудь на русском» он распознал так:

Распознавание голоса ботом
Фразы на других языках сервис не понимает

Можно загрузить аудио или видео с английской речью, сервис выведет текст. Некоторые спорные моменты из-за произношения могут расшифровываться неправильно.

Транскрибация фразы на английском
Сервис не распознал слово penguins

Программа бесплатна, она будет полезна, если вы работаете с англоязычными источниками.

Боты для голосовых сообщений

Бот в ВКонтакте

Возможности:
расшифровка записанных голосовых сообщений в текст.

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот для перевода голосовых сообщений в текст
Бот расшифровывает войсы

Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».

Как добавить бота для расшифровки голосовых
Приглашаем бота в беседу


Дальше выбираем нужный чат, куда добавим бота в качестве участника.

Бот для голосовых сообщений в ВКонтакте
Выбираем чат

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Настройка бота для расшифровки голосовых
Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Возможности: расшифровка записанных голосовых сообщений в текст.

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот для расшифровки голосовых сообщений в Телеграме
Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.


Сервисы из подборки помогут сделать расшифровку интервью в аудио или видео, узнать, что сказали в голосовом сообщении, когда нет возможности прослушать, и упростят работу с надиктованным текстом. Качество расшифровки зависит от дикции и скорости речи, поэтому требует правок.

В Яндекс.Почте появился голосовой интерфейс
Подборка статей для оптимизаторов и веб-мастеров
Главное о картинках на сайте в пяти статьях
Комментарии (9)
Kirill_Chekin   29.10.2019 13:16
Постоянно пользуюсь на конференциях, чтобы потом можно было прочитать, потому что слышишь одно, а потом прочитаешь и еще что-то новое найдешь для себя
Elena_Zhmurina   29.10.2019 14:02
Поддерживаю, очень удобно. Иногда быстро говорят и причем все важное, что не успеваешь записывать)
Natalia88   31.10.2019 05:22
Мне не особо нравятся авторасшифровка, слишком много допускают ошибок, иногда предложения переверают, еще и платные
Elena_Zhmurina   05.11.2019 15:55
Согласна( Мне редко нужна такая функция, так что пользуюсь бесплатным блокнотом для речевого ввода, о котором есть в статье. Помогает экономить силы и меньше печатать - следишь за ним и поправляешь, а не с нуля печатаешь всю речь.
Kattyha   31.10.2019 08:33
Я еще в скайпе пользуюсь записью Free Video Call Recorder for Skype, вдруг кому понадобится
maxklim   01.11.2019 09:36
Было как-то дело, подрабатывал транскрибатором, адский труд если честно, сидишь печатаешь и кажется это никогда не закончится
Elena_Zhmurina   05.11.2019 15:58
Представляю, как руки и мозги устают...
Sooreen   4 дня назад в 15:55
Вот еще сервис. https://stt.ai/
Elena_Zhmurina   4 дня назад в 23:30
Он платный) Мы тут смотрели сервисы, которыми можно пользоваться бесплатно.

Чтобы оставлять комментарии, вам нужно войти в систему

Авторизоваться