„Мы с Тамарой ходим парой“: векторные модели о персонажах русской литературы эпохи
27 ноября 2024 года состоялось очередное заседание научного семинара «Цифровая среда» Института цифровых гуманитарных исследований (DHRI) Сибирского федерального университета.
На семинаре выступили Борис Валерьевич Орехов (Высшая школа экономики) и Даниил Андреевич Скоринкин (Потсдамский университет) с докладом «„Мы с Тамарой ходим парой“: что могут сказать векторные модели о персонажах русской литературы эпохи реализма».
Векторные семантические модели известны как мощный инструмент, используемый в IT-индустрии в качестве средства обработки естественного языка, позволяющего с опорой на контекст (а не на экспертное знание) установить близость или удаленность значения различных слов. Не любой инструмент из индустрии способен стать исследовательским инструментом, но академические лингвисты научились использовать свойства векторов слов для получения нового знания о функционировании семантики. Алгоримы векторизации эффективно обобщают информацию о семантике и морфологии языковых единиц и даже шахматных ходов. Наша цель в том, чтобы научиться использовать их в computational literary studies, не теряя литературоведческого смысла (Б.И.Ярхо) этого действия.
На основе большого корпуса русской прозы XIX века мы создали векторную модель персонажей русской литературы. Для этого пришлось преодолеть ряд технических трудностей, которые все еще влияют на результат. Но благодаря этой модели мы теперь представляем, какие персонажи похожи друг на друга по своему описанию (контексту), как эспрессо и капуччино в бытовых текстах, и почему. Анна Каренина — ассоциат (векторная сестра) княжны Марьи из «Войны и мира», что имеет прямой литературоведческий смысл, а вот ближайшим ассоциатом Андрея Болконского является не похожий на него Пьер Безухов. Мы обобщим и прокомментируем случаи всех этих типов.
Слайды доклада доступны по адресу:
Орехов Борис Валерьевич – кандидат филологических наук, доцент Школы лингвистики НИУ «Высшая школа экономики», старший научный сотрудник Лаборатории цифровых исследований литературы и фольклора Института русской литературы (Пушкинский Дом) РАН, автор телеграм-канала и подкаста об университетах «Лига Айвы»:
Скоринкин Даниил Андреевич – кандидат филологических наук, исследователь и координатор DH-проектов в Университете Потсдама, главный редактор издания о цифровых технологиях в гуманитарных науках «Системный Блокъ»:
Ведущий семинара «Цифровая среда» DHRI@SFU — Андрей Юрьевич Володин (МГУ/СФУ).
Следить за новостями Института цифровых гуманитарных исследований (DHRI) удобно в телеграм-канале «Гуманитарии в цифре»:
3 views
4108
1537
13 minutes ago 00:01:28 1
[NewTV热播剧场 Hit Drama] 【片花】风起陇西丨陈恭糜冲俩人一路互怼,各不相让,快被对方气不活了
13 minutes ago 00:01:03 1
[The Times and The Sunday Times] Donald Trump heads to Washington to face charges of election lies
13 minutes ago 00:05:51 1
[CNBC Television] Twitch COO Sara Clemens: We’re seeing record levels of engagement
14 minutes ago 00:04:43 1
[CNBC Television] Markets appear significantly ahead of the Fed, says Mohamed El-Erian
14 minutes ago 00:31:49 1
[Хайлайты Сереги Пирата] Про Сложные Ночи Можно Забыть? | Серега Пират в 7 Days to Die с Дедодедом, ч.34
14 minutes ago 00:03:23 1
[TikTokTunes] Bfb Da Packman - Honey Pack (Lyrics) | i don’t like good b they just not it
15 minutes ago 00:24:18 1
[Хайлайты Сереги Пирата] Серега Пират Проходит Летную Школу в 7 Days to Die с Дедодедом, ч.36
15 minutes ago 00:01:39 1
[МВД МЕДИА] В Саратове по подозрению в сбыте фальшивых денежных купюр задержаны двое граждан
15 minutes ago 00:02:02 1
[CNBC Television] Majority of Americans thinks recession likely in next year
16 minutes ago 00:31:47 1
[ПроОбразование] КАК МИНИСТР РОДИТЕЛЕЙ СЛУШАЛ В ОБЩЕСТВЕННОЙ ПАЛАТЕ