Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)

Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры. 👀 Обо всех возможностях SpeechKit для бизнеса: Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса. 👀 Все принципы синтеза речи: По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону? На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов. 🦸‍♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов. yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы. 🎧 НА ДРУГИХ ПЛАТФОРМАХ: • Яндекс Музыка: • Apple Podcasts: • Google Podcasts: ⚡ ЧТО В ВЫПУСКЕ 00:00 — Выпуск про синтез речи 02:06 — Этика речевых технологий — что это? 04:28 — Что нужно для виртуального голоса 06:30 — «Мы варим голоса» 12:01 — Шёпот, милый, нейтральный. Какие голоса есть? 13:45 — Синтез голоса — это быстро? 16:57 — Для создания голоса ещё нужен человек? 18:37 — Час шёпота в студии, и голос готов 21:59 — Кол-центры и роботы 26:07 — «Робот никогда не устаёт» 29:43 — «Позовите оператора!» 33:10 — Самые известные голоса 34:35 — Алиса и Siri читают рэп 36:42 — Генерация голоса без людей 38:11 — Где актёры озвучки незаменимы 40:31 — Царь, Анаксимандр и Вася 41:45 — Дикторы не останутся без работы 45:45 — Робот должен представляться? 49:50 — Как понять, что говоришь с роботом? 53:44 — Лайфхак: как переключиться на оператора 55:16 — «Вам звонит синтез» 57:52 — Разговоры по телефону уйдут в прошлое? 59:49 — Культура звонков в разных странах 01:02:35 — Может ли синтез взять на вас кредит 01:06:02 — Что умеет нейросеть-эмпат 01:11:42 — Как научить нейросеть эмоциям 01:13:35 — А какая польза от эмпатичной нейросети? 01:16:24 — Строгий, милый, добрый. Какие ещё голоса бывают? 01:18:24 — Как сделать синтез своего голоса 01:20:03 — Вопросы! Можно ли объединить SpeechKit и YandexGPT? 01:22:23 — Что будет, если накричать на робота 01:23:47 — Можно ли «украсть» речь?

10,720 views

102