Техносфера Group, МГУ им. М.В. Ломоносова.
Курс “Методы распределенной обработки больших объемов данных в Hadoop“
Лекция №3 “Распределённая файловая система HDFS“
Лектор - Алексей Романенко.
Задачи, для которых подходит и не подходит HDFS. Демоны HDFS. Файлы и блоки. Репликация блоков. Клиенты, Namenode и Datanodes. Чтение и запись файла. Namenode: использование памяти. Устойчивость к отказам в Namenode. Доступ к HDFS, в том числе через прокси. Команды оболочки shell. Копирование данных в shell, удаление и статистика. Команда fsck. Права в HDFS. Команда DFSAdmin. Балансер. File System Java API. Реализация File System. Объект Configuration. Чтение данных из файла и запись в него. Подстановки (globbing).
2 views
877
314
3 months ago 00:09:36 15
Kafka БАЗА! Теория + Практика анализ данных !
1 year ago 00:01:58 1
Как Повысить FPS в CS2 и Убрать ИНПУТ ЛАГ на ПК?
2 years ago 00:51:31 7
(Не)безопасность больших данных
2 years ago 01:05:36 3
#ЦМФ BIG DATA: Amazon | Yandex | Google | Hadoop | MapReduce | 3V | Вопросы на собеседованиях | 2016
4 years ago 00:24:08 1
93 - paginator, постраничный вывод - Практика ReactJS
4 years ago 01:38:14 23
Параллельные и распределённые вычисления 4. Hadoop over SQL, Hive. Лектор -- Штохов. А.Н