podcast

Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)

14.11.2024
Listen to the episode on your favorite platforms:
  • Apple Podcasts
  • Yandex Music
  • Youtube
  • Spotify
  • Castbox
  • Pocket Casts
  • Overcast
  • Castro
  • RadioPublic

Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры.

👀 Обо всех возможностях SpeechKit для бизнеса:

https://clck.ru/3EaxN7 

Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса.

👀 Все принципы синтеза речи:

https://clck.ru/3EaxLV 

По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону?

 

На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов.

🦸‍♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов.