Академия наук РТ создаст нейросеть для голосового машинного перевода. Об этом пишет «Реальное время».
Веб-сервис должен будет уметь распознавать и синтезировать татарскую речь. Переводчик станет доступен как сайт и как мобильное приложение. Оно будет бесплатным и подойдет для всех операционных систем.
Разработчикам предстоит провести сбор, запись, сделать разметку аудиоданных, подготовить речевые датасеты татарского языка. Аудиоданные на татарском сформируют из разных стилей речи: разговорного — не менее десяти процентов, публицистического — не менее 60 процентов, а также официально-делового, художественного и научного — не менее 30 процентов. В записи поучаствуют профессиональные дикторы, ведущие телевидения и радио и работники театров. В переводчик планируют загрузить не менее 2000 голосов людей различных возрастов, полов и диалектов татарского языка.
Функционал будет работать в веб-сервисе русско-татарского машинного переводчика Tatsoft в общедоступном режиме. Программа станет базой для нескольких IT-сервисов — татарской версии ChatGPT, современного портала аудиолитературы на татарском языке, веб-сайта и телеграм-бота с речевыми сервисами и других.