Цифровая археология: восстановление конвейеров по обучению ML-моделей
Различные модели машинного обучения прочно заняли свое место в индустрии информационной безопасности. В «Лаборатории Касперского» мы используем множество моделей машинного обучения для решения различных задач, таких как обнаружение киберугроз, автоматизация внутренних процессов и многое другое. Однако, несмотря на их полезность, при разработке и поддержке таких моделей возникают определенные трудности.
Часто процесс переобучения модели превращается в долгий и сложный квест, в котором нужно найти рабочую Jupyter-тетрадь в неизвестной ветке заброшенного репозитория. Кроме того, необходимо убедиться, что ваш набор данных пополнялся все эти месяцы с момента последнего обучения. Эти трудности возникают отчасти потому, что команды, состоящие исключительно из специалистов по данным, часто сосредотачиваются на исследовательской работе в ущерб инженерной части.
Поговорим о сложностях, с которыми мы сталкивались при восстановлении конвейеров для обучения ML-моделей. Расскажем, как нам пришлось заниматься настоящей «цифровой археологией» — чтобы найти старые, забытые, не всегда корректно работающие скрипты в папках давно ушедших членов команды и заставить их работать. Подскажем, как избежать подобных проблем в будущем.
Иван Балагуров
«Лаборатория Касперского»
18 views
188
40
4 months ago 00:10:28 1
Massive H Shaped Megalithic Structures Carved From Stone Archaeologists Can’t Explain
4 months ago 00:15:34 1
Магнитометр «ГЕФЕСТ-4». Полный обзор/функционал/реальные тесты
4 months ago 00:13:22 1
Изобретение археологии !
4 months ago 01:05:56 1
Миф: этруски — это русские?/Александр Бутягин и Егор Яковлев