Евгений Косарев — Обучение GigaChat с контекстом в сотни тысяч токенов
Ближайшая конференция I’ML:
#imlconf #ml #mlops #IT #conference #jugrugroup
Языковые модели достигли высокого качества ответов в самом широком спектре задач. Однако им не хватает контекста. Документы в десятки страниц текста А4 не помещаются в контекст алгоритма. Обсудим, как GigaChat увеличил контекст модели до сотен тысяч токенов (дальше — больше) и как проверял качество получившейся модели.
Рост контекста модели требует больше GPU-памяти и тратится больше времени на его обработку как на обучении, так и на инференсе. Задача состоит в том, чтобы в распределенном сетапе ускорить модель и оптимизировать использование памяти. Для этого нам помогут следующие технологии и библиотеки:
* Flash Attention.
* Sliding Window Attention (SWA).
* Расчет активаций тензоров. Tensor Parallel, Sequence Parallel.
* Ring Attention, Striped Ring Attention.
* Бенчмарк понимания длинного контекста PassKey.
Расскажу про плюсы и минусы каждого подхода, а также объединю их в пайплайн — на котором обучался GigaChat — позволяющий обучать и использовать модели на контексте в сотни тысяч токенов.
Будет полезно NLP-разработчикам и всем, кто интересуется LLM и развитием ИИ.
Скачать презентацию с сайта —
43 views
3194
1171
4 months ago 00:03:38 1
Песенка о московском муравье. Олег Погудин. год.
4 months ago 00:03:28 1
ЗОМБ - Где Болит (ПРЕМЬЕРА КЛИПА)
4 months ago 00:05:25 1
“Летят перелётные птицы“ - Владислав Косарев
4 months ago 00:01:01 1
Евгений Кунгуров/Владислав Косарев/Максим Катырев/“Хвастать Милая не Стану“#евгенийкунгуров #память
5 months ago 00:08:38 1
26 мая 2014. Максим Катырев, Евгений Кунгуров, Владислав Косарев
5 months ago 01:37:12 1
Искатели (1956)
5 months ago 00:22:09 1
ВАС БУДУТ УДИВЛЯТЬ ТРИ БАРИТОНА:ЕВГЕНИЙ КУНГУРОВ, ВЛАДИСЛАВ КОСАРЕВ И МАКСИМ КАТЫРЁВ/ВЫ С НАМИ?
5 months ago 00:03:49 1
“Будь со мною строгой“, Владислав Косарев
5 months ago 00:05:34 1
“Даль великая“ - Владислав Косарев и Оркестр народных инструментов России им. Н. П. Осипова
5 months ago 00:05:21 1
Попурри на темы неаполитанских песен - Владислав Косарев, Максим Катырев, Евгений Кунгуров
6 months ago 00:01:55 1
“Ничего на свете лучше нету...“
6 months ago 00:01:00 1
Евгений Кунгуров, Владислав Косарев, Максим Катырев Попурри на тему Неаполитанских песен
6 months ago 00:02:20 59
Дети перемен | Эксклюзивный фрагмент | Смотрите этой осенью на START @START_SHOWS
6 months ago 00:01:03 1
Дети перемен | Тизер | Смотрите этой осенью на START @START_SHOWS
6 months ago 00:16:40 4
[Реакция] - Разоблачение Российских Либерастов и МИРОВЫХ Эльфботов @Kosarew @tvrain @sfilinom
6 months ago 00:05:28 4
Гробовая Доска – В земле
6 months ago 00:02:02 1
Евгений Кунгуров/Владислав Косарев/Максим Катырев/“Платье“/от #евгенийкунгуров
6 months ago 00:03:18 1
“Налетели вдруг дожди“ - Владислав Косарев и Симфонический оркестр Министерства обороны России
6 months ago 00:02:44 1
“Но я вас всё-таки люблю“ - Владислав Косарев, Максим Катырев, Евгений Кунгуров
6 months ago 00:02:46 1
“Хвастать, милая, не стану...“- Владислав Косарев, Максим Катырев, Евгений Кунгуров
7 months ago 00:15:05 1
Убийство Леонида Брежнева - версия историка Островского. Чазов или Андропов?
7 months ago 00:03:34 1
“Россия - родина моя“ Владислав Косарев | “Russia is my homeland“ Vladislav Kosarev
7 months ago 00:25:13 1
Большая вода надвигается на Улан-Удэ | Восточный экспресс | новости Бурятии
7 months ago 00:44:06 1
Своя чужая. Серия 4. Криминальный Детектив.Лучшие Сериалы