QMIX / Graph Attention Networks with Positional Embeddings

00:00:00 QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 00:22:58 Graph Attention Networks with Positional Embeddings QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning Во многих областях обучения с подкреплением возникает необходимость обучить сразу несколько агентов действовать в общей среде. В таких задачах важно понять, как оценивать вклады каждого из агентов в достижение общей цели. Авторы статьи “QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning” предложили новый алгоритм QMIX, который способен решать более широкий класс задач по сравнению со своими предшественниками. Новый подход был протестирован на игре StarCraft, в которой хорошо согласованные действия игроков необходимы для победы. На семинаре мы обсудим следующие темы: - Почему сложно заставить несколько агентов кооперироваться, не мешая друг другу - Какие основные подходы существуют в мультиагентном обучении - Как обучают алгор

6 views