RLHF Intro: from Zero to Aligned Intelligent Systems | Igor Kotenkov
Ссылка на презентацию: !AlnN0aqNwShslWtiuDJOR_qt3Urn
Мой телеграм канал:
Список всех моих образовательных материалов, статей, лекций итд:
Перед вами - обзорная-лекция блока Instruct Models Датафеста 2023го года. В ней рассказано о проблемах в мире машинного обучения, о несоответствии функций для оптимизации и реальных задач, для которых модели предназначаются.
В лекции будут рассказаны основы RL, языковых моделей, а затем показано, как эти два направления можно объединить, чтобы тренировать модель напрямую оптимизировать воспринимаемое человеком качество генерации. В заключении будет дан обзор текущих тенденций в мире RLHF (Reinforcement Learning from Human Feedback) и рассказано про то, что же такое AI Alignment и почему им нужно заниматься уже сейчас.
Подпишитесь на наш канал, чтобы не пропустить новые видео о машинном обучении и искусственном интеллекте. Не забудьте поставить лайк и поделиться этим видео с друзьями, если оно вам понравилось. Если у вас возникнут вопросы или предложения, оставляйте их в комментариях!
Timeline:
----
#chatgpt #ai #alignment #rlhf #Трансформеры #Машинноеобучение #Искусственныйинтеллект #NLP #DeepLearning #AI #NeuralNetworks #NaturalLanguageProcessing #MachineLearningAlgorithms #DataScience #LanguageModels #ML #GPT #OpenAI #MLengineers #chatgpt #attention #attentionisallyouneed #rlhf #rl #humanfeedback #ai #deeplearning #GPT3 #gpt4 #gpt3.5 #claude #anthropic #alignment #rlfaif
1 view
244
65
11 months ago 01:56:20 2
Let’s build GPT: from scratch, in code, spelled out.
1 year ago 01:13:58 1
What’s next for OpenAI? | SuperAlignment | Igor Kotenkov, Lecture in Russian
2 years ago 01:44:12 1
Игорь Котенков - RLHF Intro: from Zero to Aligned Intelligent Systems
2 years ago 01:44:12 3
RLHF Intro: from Zero to Aligned Intelligent Systems | Igor Kotenkov
2 years ago 00:29:35 1
Reinforcement Learning - ChatGPT, Playing Games & More • Dean Wampler • GOTO 2023