Владимир Кондратенко - Dusha: самый большой открытый датасет для распознавания эмоций в устной речи

Dusha: самый большой открытый датасет для распознавания эмоций в устной речи на русском языке Мы собрали самый большой в мире датасет для задачи SER (speech emotion recognition). Спешу рассказать о том, как именно мы его собирали, о тонкостях и трудностях с которыми столкнулись в процессе. Доклад расширяет ранее написанный пост на хабр () ( Почему это интересно: 1. Задача Speech Emotion Recognition сама по себе интересна: она вызывает ВАУ эффект (как так, нейронки и эмоции умеют предсказывать) 2. Многие компании пытались ее решать, я слышал много неудачных историй и только 2 удачные (одна из них наша) 3. Мы предлагаем хороший бенчмарк для задачи SER, данных в для этой задачи очень мало, а на русском языке и подавно. Любой исследователь/инженер который сейчас будет пытаться делать SER, будет использовать наш датасет Data Fest 2023: Трек “Open Source“: Наши соц.сети: Telegram: Вконтакте:

4 views

253