Солодушкин С.И. - практика - - часть 1 + конспект YandexGPT

Солодушкин С.И. - практика - - часть 1 конспект YandexGPT 00:09 Расписание занятий • Преподаватель объявляет о смене расписания занятий на радиотехническом факультете. • Занятия будут перенесены с пятницы на среду, чтобы избежать пересечений с другими группами. 05:37 Непараметрические методы • Преподаватель объясняет, что непараметрические методы используются для сравнения двух или более групп, не предполагая нормальное распределение. • Примеры включают тесты на Уитни, Вилкоксона и Краскела-Уоллиса. 08:24 Примеры нормального распределения, включая уровень гемоглобина у человека и печеночные трансаминазы. • Он объясняет, что данные, которые распределены нормально, имеют колоколообразный график с небольшим разбросом. 11:36 Тест Мана-Уитни используется для сравнения медиан в двух генеральных совокупностях, а не в выборках. • Он приводит оригинальную постановку теста и объясняет, что он предполагает, что две случайные величины имеют одинаковые функции распределения. 16:10 Сравнение функций распределения двух случайных величин, где одна из них обычно принимает значения меньшие, чем другая. • Это означает, что вероятность того, что первая случайная величина будет меньше определенного числа, равна вероятности того, что вторая случайная величина будет меньше другого числа. 26:28 Медиана и функция распределения • В видео объясняется, что медиана - это такое число, что половина наблюдений находится левее, а половина - правее. • Функция распределения - это вероятность того, что случайная величина меньше определенного числа. 30:37 Задача сравнения двух выборок, извлеченных из генеральных совокупностей, распределенных по закону Пуассона. • Задача заключается в том, чтобы нарисовать графики функций распределения двух соответствующих случайных величин и проверить, совпадают ли они. 34:01 Сравнение двух распределений с использованием гистограммы и критерия Пирсона. • Гистограммы показывают, что второе распределение имеет большую среднюю и максимальную величину, но это не является статистически значимым. 40:32 Визуально-аналоговая шкала для оценки боли • В видео рассматривается задача оценки интенсивности боли в кистях у рабочих, используя визуально-аналоговую шкалу. • Задача похожа на задачу сравнения гемоглобина у рабочих разных заводов, где сравниваются данные до и после лечения. 45:09 Генерация данных для задачи • В видео демонстрируется генерация данных для задачи, используя биномиальное распределение. • Данные генерируются для 40 пациентов, у которых в среднем боль оценивается на 6 баллов. • Данные затем используются для создания графиков, показывающих изменение боли до и после лечения. 51:21 Корреляционный анализ • Видео обсуждает корреляционный анализ, который позволяет оценить связь между двумя переменными. • В примере, представленном в видео, две случайные величины, цена на нефть и доход бюджета, были проанализированы на наличие статистической зависимости. • Для этого был использован коэффициент корреляции Пирсона, который позволяет оценить уровень зависимости между переменными. 01:04:04 Коэффициент корреляции Пирсона • Коэффициент корреляции Пирсона показывает уровень зависимости между двумя переменными. • Если зависимость линейная, коэффициент корреляции позволяет оценить ее тесноту. • Если зависимость нелинейная, коэффициент корреляции может не показать уровень зависимости. 01:07:52 Пример нелинейной зависимости • В видео представлен пример нелинейной зависимости, сгенерированной с использованием синуса и квадратов. • Коэффициент корреляции Пирсона для этих двух переменных равен -0,4, что указывает на отсутствие линейной зависимости. • Однако, из-за большого числа наблюдений (тысяча значений), уровень значимости (0,05) позволяет принять нулевую гипотезу о том, что две переменные статистически не связаны. 01:11:38 Коэффициент корреляции • Обсуждается коэффициент корреляции Пирсона, который измеряет силу связи между двумя случайными величинами. • Приводится пример с двумя случайными величинами, связанными более тесной линейной связью, что приводит к более узкому корреляционному облаку. • Обсуждается, как сгенерировать данные с разной силой связи и как это влияет на коэффициент корреляции. 01:21:01 Обсуждение результатов • Участники обсуждают, какому из двух наборов данных соответствует коэффициент корреляции -1047. • Некоторые участники считают, что он соответствует синему набору данных, другие - что он соответствует рыжему набору данных. • В итоге, участники приходят к выводу, что коэффициент корреляции -1047 соответствует рыжему набору данных. 01:28:01 Влияние на дисперсию • Обсуждается, как изменение дисперсии влияет на коэффициент корреляции. • Приводится пример, где дисперсия уменьшается, что приводит к уменьшению коэффициента корреляции. • В итоге, участники приходят к выводу, что изменение дисперсии может существенно влиять на коэффициент корреляции. Весь плейлист:
Back to Top