Обработка больших данных при помощи Apache Spark ч2 | Технострим
Мероприятие: Moscow Data Science Junior Meetup,
Выступающий: Виталий Худобахшов, Одноклассники
Apache Spark сегодня является одной из самых популярных технологий обработки больших данных в первую очередь за счет очень удобного API, который близок к обычному функциональному стилю программирования на Scala. Спикер расскажет, что такое Spark и как с ним работать. Рассмотрит некоторые паттерны использования Spark. И, конечно, расскажет, что такое большие данные с практической точки зрения. В качестве основных примеров разберет, как определить пол и возраст пользователя в социальной сети, если он указан с ошибкой. На этих примерах станет понятно, что можно узнать просто с помощью правильной обработки данных, даже не используя машинное обучение.
Календарь событий:
О КАНАЛЕ:
Официальный канал образовательных проектов Group
► Нажмите здесь для подписки ‣
Актуальные лекции и мастер-классы о программировании