Yandex B2B Tech запустила первый в России сервис для быстрого синтеза речи

Yandex B2B Tech представила первый в России сервис для создания голоса бренда за 20 минут. Компаниям теперь достаточно загрузить короткую запись голоса диктора, чтобы получить синтетический голос для ботов, подкастов и рекламы. Сервис Brand Voice Lite уже доступен в Yandex Cloud.

Yandex B2B Tech запустила первый в России сервис для быстрого синтеза речи Brand Voice Lite. Теперь компаниям достаточно загрузить 20–40 минут записи голоса диктора, чтобы создать уникальный голос бренда. Его можно использовать для голосовых ботов в контакт-центрах, озвучки подкастов, образовательных материалов и других бизнес-проектов. Сервис уже доступен в Yandex Cloud.

Для синтеза достаточно загрузить готовую запись или начитать текст в интерфейсе. Диктором может стать актер, владелец бизнеса или амбассадор. Дополнительные эмоции, например, грусть или агрессия, требуют еще 20 минут записи. Модель будет готова в течение семи дней.

Brand Voice Lite работает на базе ML-моделей Yandex SpeechKit, которые дообучаются под клиента. Данные хранятся в защищенных дата-центрах Яндекса. Компании должны получить согласие диктора на использование голоса, а доступ к синтезированному голосу будет только у заказчика.

«Синтезированные голоса наиболее востребованы у банков, крупных ритейлеров и телеком-операторов. С их помощью они автоматизируют первую линию поддержки. Всего с помощью технологий SpeechKit Brand Voice компании синтезировали уже более 50 голосов».

Иван Пузыревский, технический директор платформы Yandex Cloud

По данным Fortune Business Insights, мировой рынок разговорного ИИ в 2024 году достиг $12,2 млрд, а к 2025 году вырастет до $14,8 млрд. В России, по прогнозам Naumen, объем рынка диалогового ИИ в 2024 году составил бы 7,45 млрд руб.

Что будем искать? Например,ChatGPT

Мы в социальных сетях