В Яндексе создали нейросеть-полиглота, знающую более 10 языков

Команда Yandex Cloud объявила о своей новой разработке — нейросети, способной разговаривать более чем на десяти языках. 

В Яндексе создали нейросеть-полиглота, знающую более 10 языков

Как отмечают разработчики, новая модель в Yandex SpeechKit на базе машинного обучения умеет распознавать более 10 иностранных языков одновременно. С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для кол-центров с большим потоком клиентов.

Нейросеть-полиглот умеет работать как с популярными языками, такими как английский и французский, так и с более редкими — датским, финским, турецким. Модель распознаёт речь на любую тему и в разных форматах: короткие и длинные фразы, имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.

Новая мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются.

Новое мультиязычное распознавание уже доступно для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.