Основные алгоритмы в обучении с подкреплением //Демо-занятие курса «Reinforcement Learning»

Вместе с преподавателем вы познакомитесь с основными алгоритмами обучения с подкреплением. Вы начнете свой путь с обучения простого агента в задаче прохождения лабиринта и будете погружаться все глубже в теорию, усложняя поведение агента в окружающей среде. Узнаете как применять нейросети для обучения агентов, как обучить агента в среде с дискретным и непрерывным набором действий и в финале познакомитесь с методами обучения взаимодействующих агентов, способных совместно решать сложные задачи, требующие кооперации. В результате урока вы получите представление обо всем многообразии алгоритмов обучения с подкреплением и будете понимать как выбрать наиболее подходящий из них для решения ваших задач. 00:00 - Введение 15:57 - Начало базового блока об RL 29:18 - Что такое обучение с подкреплением 32:07 - Обзор алгоритмов RL 1:04:43 - Марковский процесс 1:31:00 - Практика Ссылка на материалы - «Reinforcement Learning» - Преподаватель: Игорь Стурейко (к.ф.-м.н.) - Teamlead, главный инженер проекта – НИИгазэкономика Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:
Back to Top