#ЦМФ BIG DATA: Amazon | Yandex | Google | Hadoop | MapReduce | 3V | Вопросы на собеседованиях | 2016
Илья Езепов, Data Scientist и Software Engineer, преподаватель и выпускник ЦМФ — лекция по большим данным на программе «Количественная аналитика» ЦМФ (2016 год)
Лекция Ильи не стала менее замечательной, несмотря на то, что с момента выступления (в феврале 2016 года) многое изменилось и стало неактуально, как говорилось в фильме 1939 года: ‘it is no more than a dream remembered, a Civilization gone with the wind...’
0:39 ’Big data is like teenage sex’
2:03 План выступления
3:25 История про Амазон: “что стало их жемчужиной“
6:12 “Это компьютер“
6:58 “Попробуем посчитать интернет“
9:22 “Как работает дата-центр“
11:56 “Если у Вас 10 тыс. серверов в дата центре, то Вы имеете 10 падений компьютеров в день“
13:43 Как хранить данные? Распределённые файловые системы: GFS (Google File System) и Hadoop (Hadoop Distributed File System)
19:10 Уязвимые места в распределённых файловых системах
21:50 NameNode
23:08 Сортировка массива (практика и задача на собеседовании)
26:25 MapReduce — самое важное в презентации (возможный вопрос на собеседовании)
27:05 Философское отступление про Google, TenzorFlow и нейронные сети
27:46 “MapReduce состоит из двух шагов: Map и Reduce“ (вопрос на собеседовании)
31:03 Пример работы MapReduce: расчёт выручки международной сети магазинов, продающей потребительские товары
35:12 Ещё примеры
40:18 WordCount (вопрос на собеседовании)
43:43 Сколько в интернете слов: комбайнеры (вопрос на собеседовании)
49:28 Как работает Hadoop
51:08 Про падения (вопрос на собеседовании)
53:39 История биг даты: почему возникла
54:21 3V: Volume, Variety, Velocity
58:43 Про пиво и подгузники: КОРРЕЛЯЦИИ
1:00:12 Беременность и машинное обучение
1:01:03 Как бигдата изменила работу с данными
1:02:05 Хорошие книги по BIG DATA: чтобы познакомиться и подготовиться к собеседованиям (на 2016 год)
1:04:12 Что посмотреть (на 2016 год)
1:05:08 ’A real Data Scientist [...] doesn’t exist‘
Подкаст с Ильёй:
Первая часть:
Вторая часть:
Студенческие проекты ЦМФ 2021:
Регистрация на программы «Количественная аналитика» и «Анализ данных» и «Web3: DeFi & NFT-разработка»:
@cmf_russia-cmf-2022
#BIGDATA #BIG_DATA #бигдата #биг_дата #Большие_данные #дата_центр #Хранение_данных #Amazon #Yandex #Google #Амазон #Яндекс #Гугл #MapReduce #Map #Reduce #3V #Вопросы_на_собеседованиях #WordCount #TenzorFlow #нейронные_сети #корреляции #Volume #Variety #Velocity
#Центр_математических_финансов #ЦМФ #Финансовая_эконометрика #Финансовая_математика #Случайные_процессы #Количественная_аналитика #Data_Science #Анализ_данных #1_уровень #2_уровень #проекты #Риск_менеджмент #Финансовая_аналитика #Факультет_финансов #УNVRSTY #YNVRSTY
3 views
3
0
9 months ago 00:48:35 3
[PoE ] Updated Aurabot + Spark Inquisitor/TS Deadeye/Mana Guardian builds for duo and group play
1 year ago 01:58:21 5
#ЦМФ #Подкаст | Google | Межнар | МГУ | Yandex | Kaggle | Leetcode | Python | С++| Go | Трансформеры
2 years ago 00:33:54 8
#ЦМФ #Подкаст R и Python | Эконометрика и Data Science | ММАЭ МГУ и семинар Финансовая эконометрика
2 years ago 01:37:26 2
#ЦМФ #Нейронные_сети from 0 to HERO | Поражение Каспарова | Разоблачение Перцептрона | Магия DNN
2 years ago 01:05:36 3
#ЦМФ BIG DATA: Amazon | Yandex | Google | Hadoop | MapReduce | 3V | Вопросы на собеседованиях | 2016
2 years ago 00:53:08 7
#ЦМФ Машинное обучение: деревья решений и случайный лес — классические методы классификации
3 years ago 00:49:08 1
#ЦМФ Машинное обучение: введение и логистическая регрессия #R