Сегодня состоялся релиз нового инструмента под названием SeamlessM4T от разработчиков из Meta*. Нейросетевая модель распознает речь и переводит ее на 100 языков. Сервис может просто переводить текст или речь, а может преобразовать речь в текст или озвучить текст голосом.
Синтез речи доступен на 35 языках. Алгоритм также умеет определять, когда пользователь переходит с одного языка на другой или применяет в своей речи сразу несколько.
Модель основана на предыдущих наработках компании. Ознакомиться с бесплатной демо-версией можно по ссылке, а на Гитхабе лежит полный исходный код программы.
*Meta признана экстремистской организацией и запрещена в России.