QMIX / Graph Attention Networks with Positional Embeddings
00:00:00 QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
00:22:58 Graph Attention Networks with Positional Embeddings
QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
Во многих областях обучения с подкреплением возникает необходимость
обучить сразу несколько агентов действовать в общей среде. В таких задачах важно
понять, как оценивать вклады каждого из агентов в достижение общей цели. Авторы
статьи “QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement
Learning” предложили новый алгоритм QMIX, который способен решать более широкий
класс задач по сравнению со своими предшественниками. Новый подход был
протестирован на игре StarCraft, в которой хорошо согласованные действия игроков
необходимы для победы.
На семинаре мы обсудим следующие темы:
- Почему сложно заставить несколько агентов кооперироваться, не мешая друг
другу
- Какие основные подходы существуют в мультиагентном обучении
- Как обучают алгор
6 views
8
2
3 months ago 00:03:13 1
Ademi - Sagynysh (Official audio)
5 months ago 00:06:34 1
КАК НАУЧИТЬСЯ ЭКВАЛИЗИРОВАТЬ / КАК ПРАВИЛЬНО ЧИСТИТЬ ВОКАЛ / КАК ПОЛЬЗОВАТЬСЯ PRO-Q 3