Иван Бегтин Common Data Index. Строим аналог Google Dataset Search, но проще и быстрее
Ближайшая конференция SmartData:
#SmartData #DataEngineering #IT #conference #jugrugroup
В мире существует немного поисковых систем по наборам данных. Самая известная из них — это Google Dataset Search, также существуют китайский проект , поиск по научным данным в DataCite и ряд экспериментальных проектов.
Большая часть поисковых систем по данным построены или вокруг поиска по научным данным, или универсального поиска любых датасетов, опубликованных по стандарту . Так работает Google Dataset Search, например.
Однако в реальности данных гораздо больше, существуют тысячи порталов открытых данных, геоданных, данных для машинного обучения и многих других данных. Далеко не все эти данные попадают в существующие поисковые системы и это существенно ограничивает их использование
Доклад Ивана будет о создании проекта построения поисковой системы по всем доступным данным в мире путем нескольких шагов: создания каталога порталов данных, сбора метаданных, их анализа и построения единого индекса.
Скачать презентацию с сайта —
56 views
597
144
4 months ago 00:24:11 1
Узнать за 10 секунд | FACE угадывает треки Lil Pump, Урганта, Obladaet, Марьяны Ро и еще 31 хит
10 months ago 03:00:05 1
День открытых данных 2024
11 months ago 01:40:24 1
Privacy Day 2024: Искусственный интеллект и проблемы приватности
12 months ago 00:09:41 1
Система распознавания лиц в Москве: как защитить свои биометрические данные?
1 year ago 08:05:20 1
Евразийский конгресс по защите данных | Eurasian Data Protection Congress -
2 years ago 00:10:37 1
Узнать за 10 секунд | ПОШЛАЯ МОЛЛИ угадывают хиты Oxxxymiron, Коржа, Noize MC и еще 32 трека
2 years ago 01:01:57 11
Приватность во время военных действий и глобальных катастроф – Privacy Day 2023
3 years ago 00:15:11 1
Слежка за гражданами через мобильные государственные приложения / Иван Бегтин
3 years ago 06:54:11 2
Privacy Day 2022
3 years ago 00:38:54 1
Кибербезопасность: как защитить личные данные?
3 years ago 00:59:54 3
Лучшие собутыльники: Noize MC и Anacondaz едят оливье и пьют шампанское
3 years ago 00:15:30 3
Слежка за гражданами через государственные мобильные приложения
3 years ago 00:08:38 1
Открытость информационных систем нормотворчества
3 years ago 00:20:51 1
«На “ТЫ“ с IT» про ОТКРЫТЫЕ ДАННЫЕ
3 years ago 01:05:24 1
Как организовать веб-архив и архив социальных сетей. Стандарты, инструменты и продукты
3 years ago 01:09:13 3
Панельная дискуссия: Роль смерти в культуре. Как фактор смерти влияет на базовые жизненные концепции
4 years ago 01:40:21 1
Михаил Степнов VS Иван Бегтин // Большие вопросы // Тотальные данные: контроль или удобство?
4 years ago 00:24:36 1
Запад опускает цифровой занавес
4 years ago 00:55:58 5
«Большой Брат знает всё: зачем госорганам всё больше информации о нас?» / Privacy Day 2021
4 years ago 00:11:33 1
Исследования НКО. Особенности работы с персональными данными
4 years ago 00:25:07 8
Приватность в мобильных приложениях / Privacy Day 2020
4 years ago 00:42:11 6
Сокращение чиновников, коррупция и административная реформа: разговор с Иваном Бегтиным
4 years ago 01:02:05 3
Ответственные алгоритмы: как открытость способна повлиять на легитимность технологий в обществе?
4 years ago 01:29:43 3
Открытые данные как инструмент общественного контроля борьбы с пандемией