Завершаем этот год приятными новостями. Запускаем новый формат — «Желтый Club Talks», в котором будем делиться разными впечатлениями, новостями, мыслями.
Ведущий этого выпуска — Даня Гаврилов, лид направления NLP в Tinkoff Research. В гостях — Влад Куренков, лид направления Reinforcement Learning в Tinkoff Research.
Влад вернулся с NeurIPS 2023, куда ездил с нашими статьями. Три из них были представлены в основной части конференции, одна — на воркшопе.
Делимся полезными ссылками и поясняем термины, которые ребята упоминают во время разговора.
Наши статьи на NeurIPS 2023:
▪️ CORL: Research-oriented Deep Offline Reinforcement Learning Library
▪️ Revisiting the Minimalist Approach to Offline Reinforcement Learning
▪️ Katakomba: Tools and Benchmarks for Data-Driven NetHack
▪️ XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX
Про конференции:
NeurIPS (Conference on Neural Information Processing Systems) — одна из главных мировых научных конференций по искусственному интеллекту и машинному обучению, ежегодно собирающая ведущих специалистов в области на одной площадке.
ICML (International Conference on Machine Learning) — крупная ежегодная конференция по машинному обучению.
ICLR (International Conference on Learning Representations) — международная конференция по машинному обучению.
Полезное:
Oral — секция устных докладов на NeurIPS. Статьи с таким статусом презентуются на широкую публику и получают больше цитирований и более широкий охват.
Запись воркшопа Бори Шапошникова, исследователя-разработчика направления NLP в Tinkoff Research: «Новые методы алаймента языковых моделей»:
* Парочка комментариев от Влада:
▪️ У DeepMind 180 статей на конференции (включая воркшопы и соавторство с университетами).
▪️ RSO не был опубликован на NeurIPS, но было много других статей про LLM/Alignment от них в рамках конференции.
Таймкоды:
0:00 Что такое NeurIPS: база
2:19 NIPS или NeurIPS?
2:37 Что такое NeurIPS: нетворкинг
5:12 Ходит ли Лекун на постерные сессии
6:07 Что такое NeurIPS: постерные сессии
7:23 Про Reinforcement Learning: популярно или не очень?
8:37 Как устроены постерные сессии и что было популярным
10:16 Normalizing Flows делают камбэк
12:52 NeurIPS по дням: Expo Day
14:33 Доклады, Test of Time Award — Word2Vec, Шмидхубер и другие
22:14 Что такое NeurIPS: воркшопы
26:04 Лейтмотив конференции: Foundational Models для всего
26:48 Что делают большие компании на NeurIPS
32:04 NeurIPS — это про науку?
33:43 Как связаны фонды, GateLoop и вариационный дропаут
38:32 The Next Big Thing (Gemini?)
41:38 В чем изюминка Reinforcement Learning
42:23 Статьи Big Tech на NeurIPS
46:16 Когда выйдет GPT-5?
48:27 Для чего делался и Grok и про Generalist AI Researchers
53:28 LLM для доказательства теорем
57:02 LLM для генерации кода и редактирования научных статей
59:39 Про безопасность в Новом Орлеане и дорогу до дома
1:08:14 Где будут конференции в следующем году
1:10:11 Чем стоит заниматься на конференциях