Reinforcement Learning 4: Непрерывные состояния. Метод DQN. Продолжение.

Продолжаем обсуждать метод глубокого Q-обучения (DQN), рассмотрим программную реализацию DQN, ознакомимся с библиотекой Ray. We continue to discuss the method of deep Q-learning (DQN), consider the software implementation of DQN, get acquainted with the Ray library. 00:00:00 Начало видео 00:00:12 Нейронная сеть для Q-функции 00:00:38 Deep Q-Network (DQN) method 00:01:41 DQN, DeepMind (2015) 00:06:56 DQN: Memory buffer (replay memory) 00:09:00 DQN: Один эпизод 00:16:38 DQN: Обучение 00:23:21 DQN: Гиперпараметры 00:33:42 Проблема нестабильности 00:38:08 DQN: Непрерывные действия 00:44:34 Double DQN 00:46:18 Dueling DQN 00:50:49 Библиотека Ray (rrlib) 00:55:00 Ray: Инициализация 00:57:32 Ray: Обучение 00:59:00 Ray: Mountain Car 01:02:17 Ray: Включаешь - не работает 01:09:56 Lunar Lander 01:12:55 Ray: А иногда работает 01:26:10 Lunar Lander Ukrainian IT-company. Machine Learning | Data Science | Artificial Intelligence #artificialintelligence #MachineLearning #ReinforcementLearning #ИскусственныйИнтеллект #Машинноеобучение

5 views