Слайд 1Математическая статистика
Слайд 2Задачи математической статистики
Слайд 3Оценка неизвестной функции распределения. Оценка неизвестных параметров распределения. Статистическая проверка гипотез.
Слайд 4Выборочный метод. Генеральная совокупность. Выборка
Слайд 5Опр. Исследуемая совокупность объектов наз. генеральной совокупностью ( - очень велико, в некоторых случаях количество значений, образующих генеральную совокупность, можно считать и бесконечным).
Слайд 6Опр. Совокупность объектов , отобранных случайным образом из генеральной совокупности наз. выборочной совокупностью (выборкой), где Число наз. объемом выборки.
Слайд 7Метод основанный на том, что по выборочной совокупности выделенной из данной генеральной совокупности делается заключение о всей генеральной совокупности наз. выборочным методом
Слайд 9Собственно-случайная
Выборка образованная случайным выбором элементов без расчленения на части или группы.
Слайд 10Механическая
Выборка, в которую элементы из генеральной совокупности отбираются через определенный интервал. Например, если объем выборки должен составлять 10% (10%-я выборка), то отбирается каждый 10-й элемент.
Слайд 11Типическая
Выборка, в которую случайным образом отбираются элементы из типических групп, на которые по некоторому признаку разбивается генеральная совокупность.
Слайд 12Серийная
Выборка, в которую случайным образом отбираются не элементы, а целые группы совокупности(серии), а сами серии подвергаются сплошному наблюдению.
Слайд 13Способы образования выборки
Слайд 14Повторный отбор
Каждый элемент, случайно отобранный и обследованный, возвращается в общую совокупность и может быть повторно отобран.
Слайд 15Бесповторный
Отобранный элемент не возвращается в общую совокупность
Слайд 16Статистический ряд. Статистическое распределение. Эмпирическая функция распределения
Слайд 17Варианты: Вариационный ряд: или
Слайд 18Из генеральной совокупности извлечена выборка объема наблюдалась раз; наблюдалась раза; наблюдалась раза; ………………………………… наблюдалась раз. Причем .
Слайд 19Числа называются частотами. Числа , где наз. относительными частотами.
Слайд 20Статистическое распределение выборки
Слайд 23Полигон относительных частот
Слайд 25Эмпирическая функция распределения
Слайд 26Эмпирическая функция распределения это функция равная отношению числа вариант, меньших , к объему выборки: .
Слайд 27Свойства эмпирической функции распределения
Слайд 281) 2) - неубывающая; 3) если наименьшая варианта, то при 4) если наибольшая варианта, то при
Слайд 29Пример. По данному распределению выборки построить эмпирическую функцию.
Слайд 33Статистическая совокупность
Слайд 35Число интервалов определяется по формуле Стерджеса
Слайд 36Гистограмма частот
Слайд 37Ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты равны отношению (плотность частот).
Слайд 39Площадь гистограммы частот тогда
Слайд 40Гистограмма относительных частот
Слайд 41Ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною , а высоты равны отношению (плотность относительных частот).
Слайд 43Площадь гистограммы относительных частот
Слайд 45Статистические оценки параметров распределения
Слайд 46Точечные оценки
Оценка, которая определяется одним число, наз. точечной.
Слайд 47Интервальные оценки
Оценка, которая определяется двумя числами, являющимися концами интервала, содержащего неизвестный параметр, называется интервальной.
Слайд 48Свойства точечных оценок
Слайд 49Несмещенность
Статистическая оценка наз. несмещенной, если её математическое ожидание равно оцениваемому параметру при любом объеме выборки:
Слайд 50Эффективность
Статистическая оценка наз. эффективной, если она имеет наименьшую возможную дисперсию.
Слайд 51Состоятельность
Статистическая оценка наз. состоятельной, которая при стремится по вероятности к оцениваемому параметру :
Слайд 52Теорема. Если дисперсия несмещенной оценки при стремится к нулю, то такая оценка состоятельна. Док-во: Оценка параметра несмещенная, т.е. , поэтому при из неравенства Чебышева следует
Слайд 53Но при Значит при , для каждого фиксированного : а Но тогда при
Слайд 54Генеральная средняя
или
Слайд 55Выборочная средняя
Слайд 56
Слайд 57Генеральная дисперсия
Слайд 58
Слайд 59Выборочная дисперсия
Слайд 60
Слайд 63Выборочная средняя является несмещенной и состоятельной:
Слайд 641.Рассмотрим выборочную среднюю, как случайную величину
Слайд 68
Слайд 692.Используем неравенство Чебышева:
Слайд 70Пусть тогда т.е. Значит выборочная средняя является статистической оценкой генеральной средней.
Слайд 71Выборочная дисперсия является смещенной оценкой:
Слайд 74Несмещенная оценка генеральной дисперсии - исправленная выборочная дисперсия:
Слайд 75Статистические характеристики
Слайд 78Асимметрия
Асимметрия распределения характеризуется тем, что вариант, меньших и больших моды неодинаковое число.
Слайд 79При асимметрия положительная; При асимметрия отрицательная.
Слайд 80Если , то распределение почти симметрично; если , то распределение сильно асимметрично.
Слайд 81Эксцесс
Эксцесс характеризует крутовершинность кривой распределения.
Слайд 82Если , то распределение считается близким к нормальному; если , то распределение значительно отклоняется от нормального.
Слайд 83Метод произведений
-условные варианты, -условный нуль.
Слайд 84
Слайд 87Статистическая проверка статистических гипотез
Слайд 88Нулевая гипотеза - выдвинутая гипотеза. Конкурирующая гипотеза - - гипотеза, которая противоречит нулевой гипотезе.
Слайд 89Простая гипотеза – гипотеза, содержащая одно предположение:
Слайд 90Сложная гипотеза – гипотеза, которая состоит из конечного или бесконечного числа простых гипотез:
Слайд 91Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Уровень значимости – вероятность совершить ошибку первого рода.
Слайд 92Статистический критерий - случайная величина, которая служит для проверки нулевой гипотезы. Наблюдаемым значением - значение критерия, вычисленное по выборке.
Слайд 93Критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают. Область принятия гипотезы - совокупность значений критерия, при которых нулевую гипотезу принимают. Критические точки - точки, отделяющие критическую область от области принятия гипотезы.
Слайд 94Правосторонняя критическая область – критическая область определяющаяся неравенством: ищут, исходя из требования чтобы
Слайд 95Левосторонняя критическая область – критическая область, определяющаяся неравенством: ищут, исходя из требования чтобы
Слайд 96Двусторонняя критическая область – критическая область, определяющаяся неравенством: ищут, исходя из требования чтобы
Слайд 97Если распределение критерия симметрично относительно 0 и имеются основания выбрать симметричные относительно нуля точки: то Тогда заменится или
Слайд 98Доверительная вероятность (надежность)- вероятность с которой осуществляется неравенство , т.е. Доверительный интервал – интервал, который покрывает неизвестный параметр с заданной надежностью .
Слайд 99Доверительный интервал для оценки математического ожидания нормального распределения при известном .
Число определяется из равенства
Слайд 100Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном
Число определяется по таблице
Слайд 101Критерий согласия – критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Критерии согласия: ( хи квадрат) Пирсона, Колмогорова, Смирнова и др.
Слайд 102Проверка гипотезы о нормальном распределении генеральной совокупности
Слайд 103Критерий Пирсона
Слайд 104В качестве критерия проверки примем случайную величину где -эмпирические частоты; -теоретические частоты.
Слайд 105Строим правостороннюю критическую область, исходя из требования, что в предположении справедливости , где - уровень значимости; - число степеней свободы.
Слайд 106Число степеней свободы находят по формуле где - число групп(частичных интервалов) выборки; - число параметров предполагаемого распределения, которые оценены по данным выборки. Если предполагаемое распределение нормальное, то оценивают два параметра и тогда
Слайд 107Если обозначить , то при гипотезу принимают; при гипотезу отвергают.
Слайд 108Критерий согласия Колмогорова
Слайд 109Если функция распределения случайной величины непрерывна, то практически ее эмпирическая функция распределения при сходится к .
Слайд 110Если непрерывна, то функция распределения величины при имеет пределом функцию которая не зависит от вида функции
Слайд 111По таблице найдем значение функции и затем значение функции Если , то расхождение между эмпирическими и теоретическими функциями распределения несущественно, если , то расхождение существенно.
Слайд 112Сравнение двух дисперсий нормальных генеральных совокупностей
Слайд 113В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий примем случайную величину , причем отношение большей исправленной дисперсии к меньшей:
Слайд 114Величина при условии справедливости имеет распределение Фишера-Снедекора со степенями свободы и где - объем выборки, по которой вычислена большая исправленная дисперсия.
Слайд 115Элементы теории корреляции
Слайд 116Основные задачи теории корреляции
Слайд 117О форме корреляционной связи между и в виде некоторой функциональной зависимости, которая хотя бы приближенно изображала расплывчатую корреляционную зависимость. Об оценке тесноты корреляционной связи между и , т.е. о степени близости корреляционной зависимости к функциональной.
Слайд 118Регрессии
Регрессией от называется функциональная зависимость между значениями и соответствующими условными средними значениями . Регрессии можно представить геометрически в виде ломанных линий, соединяющих или точки ( ; ), или точки ( ; ).
Слайд 119Эти линии называются эмпирическими (полученными из опыта) ломаными линиями регрессии. Плавную кривую можно получить и иначе, – если ломаную линию регрессии “сгладить” посредством какой-либо известной линии (прямой, параболы, гиперболы и т.п.). Уравнение сглаживающей линии даст хотя и приближенно, но аналитическое – в виде формулы – выражение регрессии. Подобные формулы называют эмпирическими
Слайд 120Задача отыскания эмпирической формулы распадается на две
Слайд 1211. Выбор типа линии, выравнивающей ломанную регрессии, т.е. типа линии, около которой группируются экспериментальные точки ( ; ) или ( ; ). 2. Определение параметров, входящих в уравнение линии выбранного типа, таким образом, чтобы из множества линий этого типа взять ту, которая наиболее близко проходит около точек ломаной регрессии.
Слайд 122Выбор типа линии, выравнивающей ломаную линию регрессии
Для выбора типа линии, выравнивающей ломаную линию регрессии, необходимо хорошо знать простейшие виды линий и их уравнения.
Слайд 123Определения параметров в уравнении выравнивающей линии выбранного типа
Слайд 124Метод средних применяют в тех случаях, когда выбранный тип уравнения выравнивающей линии содержит лишь один параметр. Метод проб используют, когда выбранная формула содержит несколько параметров .
Слайд 125Метод выровненных (или выбранных) точек состоит в выборе по чертежу нескольких точек (не обязательно совпадающих с точками линии регрессии), через которые проводят выравнивающую линию и определяют ее уравнение по координатам этих выбранных точек. Метод наименьших квадратов служит для оценки неизвестных величин по результатам измерений, содержащим случайные погрешности.
Слайд 126Метод наименьших квадратов
Слайд 127Необходимо минимизировать сумму где , – значения опытных данных; – значение функции, взятое из эмпирической зависимости в точке ; – число опытов.
Слайд 128В случае линейной эмпирической формулы сумма принимает вид , а в случае квадратической зависимости – следующий вид: .
Слайд 131Оценка тесноты корреляционной зависимости
Слайд 132Для оценки тесноты корреляционной зависимости служит корреляционное отношение: где – выборочная дисперсия случайной величины , вычисленная по всей таблице; – дисперсия условных средних относительно общей средней, так называемая внешняя дисперсия.
Слайд 135где – остаточная дисперсия; – число коэффициентов в уравнении регрессии; – ордината линии регрессии в точке ; – дисперсия воспроизводимости средних, равная исправленной внутренней дисперсии, деленной на число экспериментов , по которым вычислялись условные средние :
Слайд 137Величина имеет распределение Фишера с числами степеней свободы ( – число задаваемых экспериментатором значений величины , – число проводимых опытов, – число коэффициентов в уравнении регрессии). Из таблицы критических точек распределения Фишера находим .
Слайд 138Если расхождение между теоретической и эмпирической линиями регрессии значимо, уравнение не адекватно, следует взять многочлен более высокого порядка.
Слайд 139Линейная корреляция
Слайд 140Из всех корреляционных зависимостей надо особо выделить линейную корреляцию, т.е. такую, когда точки регрессии располагаются вблизи некоторой прямой линии.
Слайд 141Виды регрессии
1) регрессия на в виде функциональной зависимости ; 2) регрессия на в виде функциональной зависимости .
Слайд 142Выборочный коэффициент корреляции
Слайд 143Выборочное уравнение прямой линии регрессии на
Слайд 144
Слайд 145Если данные наблюдений над признаками и заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам : ,
Слайд 146