Синтез выразительной речи для аудиокниг | Степан Комков, Яндекс Поиск

Это доклад Степана Комкова, старшего разработчика службы синтеза речи в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Степан рассказал об опыте создания виртуального рассказчика в Букмейте. Зачем его создавали и чего хотят пользователи, как выжать максимум из технологий уходящего поколения и внедрить длинный контекст в low-resource real-time модель. И как GPT и диффузионные модели произвели революцию в синтезе речи. Подписывайтесь на телеграм-канал Яндекса для ML-специалистов:
Back to Top