Визуально-языковые модели для навигации и манипуляции / Иван Лаптев, MBZUAI, VisionLabs
В последнее время компьютерное зрение достигло больших успехов в классификации, сегментации и текстовом описании изображений. Но нынешние методы всё ещё далеки от понимания визуальных сцен. Что произойдёт, если стакан сдвинуть за границу стола? Какие действия нужны, чтобы посадить дерево? Создание систем, которые смогут отвечать на подобные вопросы по входным изображениям сцен, откроет большие возможности для будущих приложений робототехники и персональных визуальных ассистентов.
О моделях и методах обучения для визуальной навигации и манипуляции расскажет Иван Лаптев, приглашённый профессор MBZUAI, руководитель исследований в VisionLabs.
Подробнее о докладе и спикере:
Доклад в текстовом формате — в контент-хабе конференции:
1 view
949
227
3 months ago 00:37:10 1
Как Нейросети Видят Вас? / Скрытые опасности неконтролируемых нейронных сетей
3 months ago 00:14:24 2
Мозг нас обманывает! Глаз видит совсем не то, что показывает нам мозг! Что именно - смотри на 11мин
3 months ago 01:14:27 1
МЫЛЬНЫЙ ПУЗЫРЬ ИИ. Разбираемся с Павлом Paperclip
4 months ago 03:38:57 2
Как ИИ помогает воплотить самые творческие идеи в IT
4 months ago 00:04:23 6
Богиня будущего (AI Песня)
8 months ago 00:03:22 1
Зоя Стукова (AI Песня)
8 months ago 01:48:17 1
Сергей Ушакин. Отпечатки прошлого: о постколониальных архивах советской фотографии
9 months ago 00:16:54 1
Новая нейросеть уничтожила ChatGPT 4 по всем пунктам! Обзор Claude 3
9 months ago 00:41:36 1
OpenAI и Figure показали человекоподобного робота, который думает с помощью ИИ — ChatGPT обрел тело
10 months ago 00:41:37 1
Визуально-языковые модели для навигации и манипуляции / Иван Лаптев, MBZUAI, VisionLabs
11 months ago 01:26:41 1
Стратегия WhatsApp маркетинга 2024. Рассылки в WhatsApp + ChatGPT
11 months ago 00:09:15 1
На какие нейросети обратить внимание в 2024 году
2 years ago 00:13:52 1
CG Новости. Chat GPT обзаводится внешностью и голосом. ИИ описывает YouTube. Ретаргетинг в Cascadeur
2 years ago 00:04:41 10
КАКИЕ ПРОФЕССИИ ПОДХОДЯТ ДЛЯ МЕЛАНХОЛИКОВ 2023 АНАЛИТИК ИЛИ АУДИТОР
3 years ago 00:34:14 6
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision
4 years ago 00:56:09 5
Запись вебинара “Как объяснить сложные вещи простым языком с помощью BPMN“, Наталья Ющишина,
5 years ago 00:46:08 1
Программа привлечения богатства и успеха. Медитация-ключ к успеху. Язык подсознания-как его понять?