Техносфера Group, МГУ им. М.В. Ломоносова.
Курс “Методы распределенной обработки больших объемов данных в Hadoop“
Лекция №12 “Spark“
Лектор - Алексей Романенко.
Мотивация. RDD. Программная модель Spark. Higher-Order Functions. Трансформация RDD (Map, Reduce, Join, CoGroup, Union и Sample). RDD actions. SparkContext. Создание RDD. Общие переменные (broadcast, accumulator). Движок Apache Spark. Программный интерфейс Spark. Lineage. Зависимости между RDD (Narrow, Wide). Расписание задач. Отказоустойчивость RDD. Управление памятью. Приложения, которые подходят и не подходят для RDD.
3 views
805
274
3 months ago 00:09:36 15
Kafka БАЗА! Теория + Практика анализ данных !
5 months ago 00:26:16 1
C++ Introduction | C ++ Tutorial | Mr. Kishore
6 months ago 00:25:44 1
Structures in C | C Language Tutorial
6 months ago 00:11:51 1
Introduction to Pointers | C Language Tutorial
7 months ago 00:28:53 1
В 6 лет учу машинному обучению. Модель Титаника
8 months ago 00:50:11 1
Mad Stream: Укрощение больших данных: Hadoop, Spark, Databricks. Александр Сайков
9 months ago 00:45:16 1
Making Kafka Queryable with Apache Pinot • Tim Berglund • GOTO 2023
9 months ago 00:03:01 1
Тестирование ИТ-специалистов
11 months ago 08:12:37 2
Python for Machine Learning full Course | Learn AI
1 year ago 00:17:55 1
Начало работы с apache airflow - “Школы Больших Данных“ г. Москва
1 year ago 00:47:15 1
Building a Real-Time Analytics Database • Tim Berglund • GOTO 2023
1 year ago 00:17:59 2
ETL на airflow - Курсы “Школы Больших Данных“ г. Москва
2 years ago 00:35:20 22
Безносов Николай - MLOps в билайн: как катить машинное обучение в production без ML-инженеров
2 years ago 00:43:23 1
Expert Talk: Unlocking the Power of Real-Time Analytics • Tim Berglund & Adi Polak • GOTO 2023
2 years ago 00:51:31 7
(Не)безопасность больших данных
2 years ago 00:10:56 9
Real-Time Spark Project |Real-Time Data Analysis|Architecture|Part 1| DM | DataMaking | Data Making
3 years ago 04:05:16 4
Ozon Tech ML Meetup
3 years ago 01:54:52 1
Онлайн-митап «Основы работы с PostGIS, Hadoop и Spark»
3 years ago 00:23:30 20
Airflow в задачах машинного обучения - Курсы “Школы Больших Данных“ г. Москва
4 years ago 07:15:32 26
Spark Full Course | Spark Tutorial For Beginners | Learn Apache Spark | Simplilearn
4 years ago 01:10:44 10
Big Data Analytics for Beginners | Big Data Tutorial in 2021 | Learn Big Data | Great Learning
4 years ago 00:06:21 1
Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn
4 years ago 01:03:19 7
Spark 3.0: что нового? // Бесплатный урок OTUS
4 years ago 00:59:59 2
Big Data Processing with Spark | Big Data Processing using PySpark | Intellipaat