Корпорация Microsoft замахнулась на вполне реальную разработку “автоматического переводчика”, который способен в буквальном смысле говорить человеческим голосом. Фразу, сказанную на английском языке, программа воспроизведёт тем же голосом, но только уже на другом языке.

В минувший вторник в штаб-квартире Microsoft в Редмонде сотрудник исследовательского подразделения корпорации Фрэнк Сун продемонстрировал, как его программа воспроизводит текст на испанском голосом руководителя Microsoft Research Рика Рашида, а затем помогает Крейгу Манди, директору Microsoft по исследованиям и стратегическим разработкам, “заговорить” по-китайски.

“Автоматический перевод” – это одна из “стандартных” реалий научной фантастики, но, увы, не повседневной действительности. Автоматические переводчики нынешнего поколения, мягко говоря, очень далеки от совершенства, и даже если “котята-афроамериканцы” и тому подобные курьёзы остались в прошлом, то получить вменяемый литературный текст в результате машинного перевода по-прежнему практически невозможно.

Microsoft же готовит устройство, которое не только позволит общаться с собеседником “своим собственным голосом”, но на другом языке, даже если вы этого языка не знаете. Логично предположить, что это подразумевает способность программы столь же адекватно переводить разговорную речь, как это делал бы переводчик-человек. Потому что в противном случае игра с распознаванием голоса просто не имела бы практического смысла. Также большой вопрос, до какой степени и с какой точностью эта программа способна воспроизводить интонацию. Ибо, как мы все знаем, при личном общении словами человек передаёт лишь часть информации, и подчас не самую существенную.

Впрочем, согласно свидетельствам очевидцев, голос всё равно звучит не слишком натурально – его “синтетическая” природа вполне отчётлива. О том, насколько адекватен перевод, сказать сложно. Аудиозаписи доступны по вышеприведённой ссылке.

Technology Review пишет, что системе требуется около часа, чтобы выработать языковую модель, благодаря которой она сможет воспроизводить любой текст голосом своего обладателя. Эта модель сравнивается с типовой моделью трансляции текста в речь на нужном языке и конвертируется в другую, способную воспроизводить текст на ином языке. Отдельные звуки, из которых первая модель формирует слова с использованием голоса человека на его собственном языке, видоизменяются так, чтобы новая модель обладала полноценной возможностью воспроизводить фразы на втором языке.

Переоценить значимость качественного автоматического переводчика сложно. Парадоксально, но факт: разработчики этой программы утверждают, что она поможет изучать иностранные языки. Именно поможет, а не устранит необходимость в этом: дескать, изучающим незнакомый язык будет значительно проще воспринимать и воспроизводить иностранные фразы, если они будут слышать собственный голос.

Что ж, обнадёжили: необходимость напрягать мозги и учить другие языки ещё не скоро отпадёт. Да здравствует Вавилонская башня!