Нейросеть-полиглот Яндекса заговорила на узбекском языке

Команда Yandex Cloud объявила о своей новой разработке — нейросетях, которые могут распознавать речь и воспроизводить её на узбекском языке. Компании как в России, так и в Узбекистане уже могут использовать новый язык в сервисе Yandex SpeechKit для создания голосовых помощников, автоматизации кол-центров и речевой аналитики.

Нейросеть-полиглот Яндекса заговорила на узбекском языке
Сгенерировано нейросетью Midjourney

Как отмечают разработчики, для обучения нейросети синтезу нужно минимум 30 часов качественной записи диктора в студии, а вот для распознавания лучше подойдут записи с шумами, кашлем и помехами.

Нейросети для синтеза и распознавания узбекского работают с латинским алфавитом, который используется в Узбекистане уже больше 20 лет. При этом алгоритмам пришлось выучить и некоторые звуковые особенности букв. Например, буква «X» обозначает в алфавите твёрдый звук [х], а в иностранных словах может произноситься как [кс].

Нейросеть-полиглот Яндекса заговорила на узбекском языке
Иллюстрация: Yandex Cloud

Модели доступны на сайте и настраиваются стандартными средствами в API. Синтез и распознавание узбекского языка с помощью Yandex SpeechKit уже начал использовать ряд компаний, например Kolesa Group. Также технологию уже интегрируют в свои решения компании-партнёры, в том числе Tomoru, JustAI, Unistar Digital и TargetAI.


Источник