«Kandinsky: развитие моделей генерации изображений и видео по тексту»
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
Денис Димитров, Исполнительный директор по исследованию данных в Sber AI, научный консультант в Институте искусственного интеллекта AIRI
Последние несколько лет без преувеличения можно назвать расцветом генеративных моделей, при этом работающих с самими разными модальностями. Доклад будет посвящен одним из самых трудоемких и сложных задач этого направления — задачам синтеза изображений и видео по текстам на естественном языке и основным подходам к их решению.
В первой части доклада обсудим задачу генерации изображений (в основном условной генерации по тексту). Остановимся на истории задачи, подробно обсудим основные методы и архитектуры для её решения, на каких данных такие архитектуры обычно учатся, поговорим о метриках для оценки качества генераций. Также поговорим о развитии моделей Kandinsky: от трансформерных архитектур (Malevich, Kandinsky 1.0) до диффузионных (Kandinsky 2.X и 3.X). Поговорим про ключевые результаты последних релизов моделей Kandinsky 2.1 и 2.2, обсудим планы развития линейки моделей Kandinsky.
Во второй части доклада затронем задачу генерации видео по текстовому описанию (причем обсудим как создание различных видов анимации, так и end-to-end генерацию полноценных видеороликов по тексту), основные трудности обучения моделей и способы оценки их качества. Немного поговорим и о нашей новой модели генерации видео: Video-Kandinsky.
1 view
5520
1707
3 weeks ago 01:11:18 1
Искусственный интеллект: Ключ к трансформации человечества. #ии #ai
3 months ago 05:47:59 1
Семь Бессмертных Даосов
5 months ago 00:11:08 1
Рахманинов. Его “10 характерных признаков прекрасной фортепианной игры“.
5 months ago 00:54:33 1
Метафизическое искусство - альтернатива совриску. Манифест мета-авангарда. Экскурс в направления.
6 months ago 00:18:58 1
👗 Обзор бесплатной AI примерки одежды для развлечения и создания изображений для маркетплейсов.
6 months ago 00:09:55 1
GigaChat vs ChatGPT — что внутри, и какие перспективы у российской модели за рубежом? | ИИнтервью
6 months ago 00:02:26 3
Урбан-тур в Екатеринбурге от Этажи Девелопмент
7 months ago 00:07:08 1
АРКТИЧЕСКИЕ НОВОСТИ #4/ радиационная опасность, хаски - спецназ и долгожданный фильм
7 months ago 01:32:16 15
Лекция «Кинестезия ‒ “шестое чувство“ авангарда» | Ирина Сироткина
7 months ago 00:50:54 1
Презентация двухтомника «Василий Кандинский. О духовном в искусстве»
7 months ago 00:44:16 1
Стоит ли опасаться искусственного интеллекта? Эксперты и нейросеть ответят на вопросы малого бизнеса
7 months ago 00:55:26 1
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.2)
7 months ago 00:53:35 1
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.1)
8 months ago 00:50:06 1
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
8 months ago 01:04:16 1
Сказки с нейросетями с Валентином ▶ Алиса в стране чудес
8 months ago 01:41:32 3
ИИ в прошлом и будущем. Сергей Марков #23
9 months ago 00:01:58 1
Секреты работы с нейросетями
9 months ago 01:23:18 1
Полный разбор 1 варианта из нового сборника 2024 | Обществознание ОГЭ | Умскул
10 months ago 00:12:41 1
Космос и Авангард: рисуем по мотивам Кандинского. Искусство детям - Творчество с ребёнком
10 months ago 00:47:29 1
Русский авангард. Искусство 20 века. Чёрный квадрат: Почему так дорого? Малевич, Кандинский, Татлин
10 months ago 00:17:34 1
Общество (байки из таверны)
10 months ago 00:24:25 1
Урок Adobe Illustrator: Дизайн свадебного приглашения и нейросеть Кандинский