Human-level performance in first-person games with population-based deep reinforcement learning

На текущий момент обучение с подкреплением добилось больших успехов в сложных окружениях с одним агентом, а также в пошаговых играх между двумя агентами. Однако в реальном мире агентов гораздо больше, причём каждый из них обучается и действует независимо от других. Окружения, которые пытаются отразить такой уровень сложности, до сих пор остаются открытой проблемой для исследователей. Недавно DeepMind выпустила статью, в которой им удалось обучить агентов играть на уровне человека в командной игре Quake III

5 views