Новая модель умеет распознавать более 10 языков одновременно. С ее помощью разработчикам будет проще создавать многоязычных голосовых помощников и роботов для колл-центров.
Специалисты Yandex Cloud разработали нейросеть, которая способна определять язык и автоматически переключаться между разными наречиями в одном потоке. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания. «Полиглот» владеет популярными языками, такими как английский и французский, и знает более редкие — датский, финский, турецкий.
Модель работает на базе архитектуры Transformer — обрабатывает входные слова параллельно и независимо друг от друга, поэтому быстро обучается. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть учили на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений Яндекса.