Алексей Скрынник | Демонстрации и трансформеры в RL

Научный сотрудник AIRI Алексей Скрынник рассказывает про демонстрации и трансформеры в обучении с подкреплением. Повествование основано на доступных данных при обучении моделей и разделено на шесть вариантов: поведение эксперта, эксперт и симулятор, демонстрации, поведение и симулятор, демонстрации и среда, поведение и среда. Доклад начинается с разбора классического подхода копирования поведения (behavioral cloning) и заканчивается современными трансформенными моделями, которые качественно решают сложные игровые задачи, по видео из YouTube (Video PreTraining). Ссылка на презентацию: Плейлист со всеми лекциями «Лето с AIRI»: Анонсы научных мероприятий всегда публикуются в Telegram-канале AIRI:
Back to Top