Описательная статистика. Анализ данных #3. Что такое описательная статистик? Какие бывают описательные статистики? В теме рассматриваются следующие описательные статистики: выборочное арифметическое среднее, медиана, размах, квартили, квартильный размах, ящичная диаграмма, дисперсия, выборочное стандартное отклонение.
На первом этапе анализа данных обычно дают общую характеристику собранных сведений. Для этого работают с описательными статистиками, которые различаются в зависимости от типа шкалы.
Для номинальных и порядковых шкал описательными статистиками являются круговые и столбиковые диаграммы, а также частотные таблицы.
Выборочное среднее арифметическое (Mean) самая распространенная описательная статистика, позволяющая быстро охарактеризовать выборку количественных значений. Это ее основной плюс. Минус – это то что среднее не всегда адекватно отражает значения выборки.
Медиана (Median) – это значение в отсортированной выборке, которое делит ее на две равные части, т.е. для ее расчёта необходимо сделать два шага: 1) отсортировать выборку, расположив ее элементы от большего к меньшему; 2) если в выборке 2.1) нечетное число элементов, то найти число, которое делит ее пополам, если 2.2) четное, что от двух серединных значений найти среднее арифметическое. Отсортируем данные в таблице ниже, рассчитаем медианы.
Точка, отделяющая 25% выборки, начиная с минимального значения, называется нижняя квартиль, а точка, отделяющая 75% выборки, начиная с минимального значения, называется верхняя квартиль. Оставшиеся в центре 50% выборки – это квартильный размах.
На базе этих статистик строится ящичная гистограмма (box-plot, ящик с усами), она служит для оценки выборки, с точки зрения квартилей, квартильного размаха, выбросов, грубых ошибок, медианы и распределения данных.
По итогам анализа диаграммы грубые ошибки (экстремальные значения) должны быть исключены из анализа или рассмотрены отдельно. Решение об оставлении или исключении выбросов может быть принято с учетом знания изучаемого явления и целей анализа.
Помимо квартильного размаха рассчитывают и просто размах выборки (Range). Он представляет собой разницу между максимальным и минимальным значениями выборки.
Дисперсия (Variance) – это мера рассеяния переменной. Среднее арифметическое квадратов отклонений переменной от ее среднего значения.
Выборочное стандартное отклонение (Std. Deviation) – еще одна характеристика отклонения от среднего значения. Эта статистика является производной от дисперсии (квадратный корень из дисперсии).
СТАТИСТИКА STATISTICA
1 view
565
160
2 months ago 00:09:53 1
Коэффициент корреляции Пирсона в Excel
2 months ago 00:29:18 1
Множественная регрессия. Часть 1
2 months ago 00:06:44 1
Описательная статистика
3 months ago 00:48:18 1
Навыки траблшутера 070. Дашборды. Максим Мухтаров и Даниил Шмитт
4 months ago 00:43:00 6
Основы общей психологии. Лекция 1. Общая характеристика психологии как науки.
5 months ago 00:04:38 1
9. SPSS. Меры центральной тенденции. Сравнение средних.
6 months ago 00:11:17 1
Первый анализ набора данных в R
6 months ago 00:56:08 1
Корреляционно-регрессионный анализ многомерных данных в Excel
7 months ago 00:02:58 1
22. SPSS. Равенство (однородность) двух выборок. Критерий Хи-квадрат. Вариант 1.
7 months ago 00:03:37 1
8. Определение мер центральной тенденции с помощью SPSS. Социология и психология.
7 months ago 00:03:23 1
4. Линейные общие распределения в SPSS. Настраиваемые таблицы. Социология и психология.