Поиск по архивам: как найти историю семьи в документах XVIII века (yet another podcast #33)

Год назад Яндекс запустил «Поиск по архивам». Это сервис, в котором можно искать информацию по архивным документам почти как в интернете. Для этого разработчики обучили нейросети расшифровывать рукописные записи со сложной дореволюционной орфографией. Сейчас в базе более 11 миллионов архивных документов из хранилищ Москвы, Астраханской, Оренбургской, Иркутской и других областей. Это метрические книги, исповедные ведомости и ревизские сказки XVIII — начала XX века. Они будут полезны как историкам, так и тем, кто хочет больше узнать о прошлом своей семьи. 👉 «Поиск по архивам»: В yet another podcast обсуждаем, что интересного можно найти в архивах и как мы обучили нейросеть распознавать букву Ѣ. Разобраться с исторической темой помогают руководитель «Поиска по архивам» Александр Болховитянов и руководитель группы распознавания текста Татьяна Сапатова. yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы. 🦸‍♂️ В гостях — Иван Корякин, автор телеграм-канала «Генеалогика» и подкаста «Откуда родом» 🎧 НА ДРУГИХ ПЛАТФОРМАХ: • Яндекс Музыка: • Apple Podcasts: • Google Podcasts: ⚡ ЧТО В ВЫПУСКЕ 00:00 — Поиск, но не в интернете 02:13 — Сколько архивов в России 05:23 — Легенда про суперархив мормонов 11:19 — Раньше даже бумага была лучше 13:13 — Как сделать запрос в архив 17:47 — Фонд и опись: глоссарий архивов 19:29 — Архивный мем! 22:00 — Зачем придумали «Поиск по архивам» 23:19 — Три главных вызова 27:03 — Как обучали нейросеть 31:39 — Что такое метрическая книга 34:30 — Нейросеть видела слова везде 39:27 — Учили на «Анне Карениной» 42:58 — Байка про The Beatles 46:50 — Ефросинья или баранина 49:41 — 40 000 долларов за 10 символов 54:23 — Особенности старой орфографии 01:02:48 — Нейросеть YASTREB 01:05:01 — Распознавание почерка врачей? 01:08:21 — Особенности тайского и корейского 01:10:39 — Тамбов как треть Европы 01:13:37 — Про коллаб с Genotek и «Великими описями» 01:19:38 — Кушелев — про семейное древо 01:21:48 — С чего начать поиск предков 01:25:42 — Да, но зачем всё это?
Back to Top