Искусственная речь из динамиков смартфонов будет звучать более реалистично

Междисциплинарная группа из университета Висконсина-Милуоки (США) получила грант в размере 200 тыс. долларов на развитие исследований проблем в области синтеза речи. Усилия группы учёных направлены на разработку удобной кроссплатформенной системы, которая позволила бы лицам с нарушенной функцией речи вернуть радость вербальных коммуникаций без покупки специализированной техники – смотрите видео.

Наверняка многие слышали о синтезаторе, которым после операции на горле с 1985 года вынужден пользоваться физик Стивен Хокинг. Изначально подобные устройства изготавливались штучно, были довольно сложными и дорогими. Затем девяностые годы принесли нашествие мультимедийных технологий. Вслед за ними широкое распространение получили более простые способы преобразования текста в речь.

Вскоре синтезаторы речи стали повсеместно применяться для озвучивания информационных сообщений в различных автоматизированных системах, голосовой почте и просто для развлечения. В наши дни такая процедура доступна на любом компьютере. Некоторые даже используют системы озвучивания текстов для кустарного создания аудиокниг, чтобы уменьшить зрительную нагрузку.

Современные алгоритмы синтеза речи позволяют обучаться особенностям произношения, настраивать темп, тембр и расстановку ударений, однако этого недостаточно для психологического комфорта.

Лингвисты и психологи ставят отдельной задачей восстановление собственного голоса пользователя и подбор интонаций, максимально соответствующих образу владельца. Особенно сложно сделать это для человека, который был нем с рождения.

Совместными усилиями исследователи намерены разработать набор алгоритмов, способный работать на популярных мобильных устройствах (смартфонах, планшетах). Создаваемая с их помощью искусственная речь должна быть более плавной, эмоционально насыщенной и, в идеале, неотличимой от живой.

Что будем искать? Например,ChatGPT

Мы в социальных сетях