Большие данные и машинное обучение, лекция-4: визуализация данных Python+Pandas+Matplotlib, часть-1
- Обзор библиотек визуализации данных: Matplotlib, Seaborn, Mayavi
- 3д: Matplotlib axis-3d vs Mayavi
- Matplotlib pyplot NumPy: математика над вектором значений, график по точкам
- Pandas Matplotlib:
- Данные: датасет ILO (МОТ - Международная организация труда)
- Таблица для анализа: средня зарплата по видам деятельности, полу, странам и годам
- Этапы решения задачи по визуализации: задать вопрос, на который ответит график, выбрать подходящий типовой график, подготовить данные - фильтрация, группировка, прочие преобразования
- Строим график: столбчатая диаграмма (bar chart) средней зарплаты в России по годам в долларах США (CUR_TYPE_USD)
- Подготовка данных: фильтрация данных, выбор колонок для столбиков, группировка значений по горизонтаельной оси -
- Заголовок и легенда
- Несколько стобликов внутри групп, рубли и доллары на одном графике: простой set_index не подойдет, необходимо перегруппировать данные
- Сводная таблица : преврати