Обучение LLaMa с подкреплением (Reinforcement Learning from Human Feedback, RLHF)
Материалы к видео:
00:00 - установка requirements
01:50 - LoRa-адаптеры
02:48 - датасет StackExchange для обучения LLaMa
08:01 - обучение Reward Model
13:40 - обучение LLaMa генерировать ответы на вопросы с помощью PPO (Proximal Policy Optimization)
47 views
2097
580
4 days ago 01:05:28 1.4K
Жизнь русских в Аргентине. Интервью с Алексеем Чигиревым про высшее образование в Аргентине.
6 days ago 00:00:50 2
: обновление ТTS-модели с возможностью клонирования голоса. OuteTTS-0
3 weeks ago 00:01:04 2
LLaMA-Mesh : метод генерации 3D-мешей с помощью LLM. LLaMA-Mesh - метод, разработанный NVIDIA Labs
4 weeks ago 01:03:45 414
Как работает ChatGPT? Разбираем простым языком || Интенсив
4 weeks ago 00:04:15 19
Чат-боты для телеграм с искусственным интеллектом, LLaMa или ChatGPT, для продаж, HR, обучения.
1 month ago 00:06:02 9
[Ruslan Dev] Llama 3.1 обзор модели и способов файнтюнинга
1 month ago 00:14:45 1
Как установить Stable Diffusion 3.5 Large и Turbo на компьютер? Пошаговая инструкция для Windows.
2 months ago 00:00:11 12
😯 Anything you can do, I can do better #shorts @FurryTails
2 months ago 00:14:05 8
Qwen-2.5 The BEST Opensource LLM EVER! (Beats Llama + On Par With GPT-4o)
3 months ago 00:13:16 1
Файнтюнинг и квантизация Llama-3 70B
3 months ago 00:39:15 1
Илья Гусев - Синтетические датасеты как способ сокращения неравенства
3 months ago 00:01:11 3
OpenVLA: Open-Source Vision-Language-Action модели. OpenVLA - набор моделей с 7млрд
3 months ago 02:13:34 38
8. Let’s build the GPT Tokenizer
3 months ago 02:25:52 34
1. The spelled-out intro to neural networks and backpropagation: building micrograd
3 months ago 00:05:31 1
🦙Llama Llama Red Pajama - Animated Read Aloud Book
3 months ago 00:19:31 12
Как стать Data Scientist с нуля в 2024 году? Гайд по входу в профессию.
3 months ago 00:21:41 2
How A State-of-the-Art AI Chatbot Is Made [ft. Llama-3.1 405B]
3 months ago 01:00:22 14
Inside GPT – Large Language Models Demystified - Alan Smith - NDC Oslo 2024
3 months ago 00:06:01 1
Инструкция для чат-бота в Telegram AiBornRuBot
4 months ago 00:04:12 3
Zuck’s new Llama is a beast
4 months ago 00:08:04 4
Mixtral 8x7B - новый ИИ. Нейросети, которые ДОМИНИРУЮТ на другими моделями
4 months ago 00:13:20 54
Применение ИИ в атаках
4 months ago 00:18:15 47
Обучение LLaMa с подкреплением (Reinforcement Learning from Human Feedback, RLHF)
4 months ago 00:13:59 76
Подробный разбор дообучения (fine-tuning) LLaMa (на примере задачи генерации заголовков к новостям)