5. В функцию γ(n) подставляют имеющиеся конкретные выборочные данные х1,...,х2 и подсчитывают численную величину γ(n). Если окажется, что вычисленное значение принадлежит области правдоподобных значении γ(n) то гипотеза Н0 считается не противоречащей выборочным данным. В противном случае, т. е. если γ(n) слишком мала или слишком велика, делается вывод, что γ(n) на самом деле не подчиняется закону f γ(n)(u), и это несоответствие мы вынуждены объяснить ошибочностью высказанного нами предположения Н0 и, следовательно, отказаться от него.
На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемой стохастической системы. Например, исследователь высказывает предположение: «исследуемые наблюдения извлечены из нормальной генеральной совокупности» или «среднее значение анализируемой генеральной совокупности равно нулю».
Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1,х2…хn, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
Результат подобного сопоставления может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться), либо неотрицательным (данные наблюдения не противоречат высказанной гипотезе), а потому ее можно принять в качестве одного из естественных и допустимых решений. При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное нами предположительное утверждение является наилучшим, единственно подходящим: просто она не противоречит имеющимся у нас выборочным данным, однако таким же свойством могут наряду с H обладать и другие гипотезы.
По своему прикладному содержанию высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.
При обработке ряда наблюдений х1,х2…хn , (5)
исследуемой случайной величины ξ очень важно понять механизм формирования выборочных значений хi, т.е. подобрать и обосновать некоторую модельную функцию распределения Fмод(x), с помощью которой можно адекватно описать исследуемую функцию распределения Fξ(x). На определенной стадии исследования это приводит к необходимости проверки гипотез типа: (6)
где гипотетичная модельная функция может быть как заданной однозначно (тогда Fξ(x) = F0(x), где F0(x) - полностью известная функция), так и заданной с точностью до принадлежности к некоторому параметрическому семейству (тогда Fмод(x) = F(х;θ), где θ - некоторый, вообще говоря, к-мерный параметр, значения которого неизвестны, но могут быть оценены по выборке (5).
Проверка гипотез типа (6) осуществляется с помощью так называемых критериев согласия и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения Fξ(n)(x) и гипотетическим модельным законом Fмод(x).
Наиболее типичные задачи такого рода характеризуются следующей обшей ситуацией. Пусть мы имеем несколько «порций» выборочных данных типа(5):
(7)
Эти порции могли образоваться, например, естественным образом - в ходе проведения выборочного обследования (скажем, за счет разделенности условий их регистрации во времени или пространстве). Обозначая функцию распределения, описывающую вероятностный закон, которому подчиняются наблюдения j-й выборки, с помощью Fj(x) и снабжая тем же индексом все интересующие нас эмпирические и теоретические характеристики этого закона (средние значения âj и аj; дисперсии σ2j и σ2j ).
В случае неотрицательного результата проверки этих гипотез говорят, что соответствующие выборочные характеристики (например, а1, а2,..,аi) различаются статистически незначимо.
Пусть, например, ряд наблюдений (5) дает нам значения некоторого параметра изделий, измеренные на n изделиях, случайно отобранных из массовой продукции определенного станка автоматической линии, и пусть а0 заданное номинальное значение этого параметра. Каждое отдельное значение хi - может, естественно, как-то отклоняться от заданного номинала. Очевидно, для того чтобы проверить правильность настройки этого станка, надо убедиться в том, что среднее значение параметра у производимых на нем изделий будет соответствовать номиналу, т. е. проверить гипотезу типа
(11)
В общем случае гипотезы подобного типа имеют вид:
(12)
где θ - некоторый параметр (многомерный), от которого зависит исследуемое распределение, а Δ0 - область его конкретных гипотетических значений, которая может состоять всего из одной точки.
Статистическая проверка гипотез о числовых значениях параметров играет важную роль в эконометрическом моделировании, регрессионном анализе, в широком спектре задач статистического исследования зависимостей, существующих между анализируемыми показателями. В частности, принятие решения о включении или исключении той или иной переменной в анализируемую регрессионную (эконометрическую) модель, о наличии-отсутствии статистической связи между наблюдаемыми признаками существенно опирается обычно на проверку гипотез типа (12) при Δ0= 0.
Заключение
На основании проделанной работы можно сделать следующие выводы.
Вероятность любого события А определяется как сумма вероятностей всех элементарных событий, составляющих событие.
Априорный подход к вычислению вероятностей P{wi} заключается в теоретическом, умозрительном анализе специфических условий данного конкретного случайного эксперимента. Вероятность события в данном классе ситуаций может быть определена как отношение числа благоприятных исходов (т. е. элементарных исходов, входящих в это событие) к числу всех возможных исходов (так называемое классическое определение вероятности).
В соответствии с апостериорно-частотным подходом, вероятность Р{wi} определяется как предел относительной частоты появления исхода в процессе неограниченного увеличения общего числа случайных экспериментов n.
Апостериорно-модельный подход заключается в следующем: в рамках априорного подхода разработан и использован набор модельных вероятностных пространств. Исследователь располагает результатами ограниченного ряда случайных экспериментов, согласно которому он выбирает ту или иную вероятностную модель или модели, которые соответствуют этим результатам наилучшим способом.
Стохастические зависимости проявляются только в массовых процессах и при большом числе единиц совокупности. При стохастической зависимости для заданного значения объясняющей переменной можно указать ряд значений зависимой переменной, случайным образом рассеянных в интервале, то есть каждому фиксированному значению аргумента соответствует определенное статистиче5ское распределение значений функции. Это объясняется тем, что зависимая переменная кроме выделенной переменной подвержена влиянию ряда не контролируемых факторов, а также тем, измерения переменных неизбежно сопровождаются случайными ошибками. Наиболее распространенной в эконометрических приложениях формой представления стохастической зависимости является аддитивная линейная форма.
Процедура обоснованного сопоставления высказанного исследователем предположительного утверждения (гипотезы) относительно природы или величины неизвестных параметров рассматриваемой стохастической системы с имеющимися в его распоряжении результатами наблюдения, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.
По своему прикладному содержанию гипотезы, высказываемые в ходе статистического анализа и моделирования, подразделяют на следующие типы: об общем виде закона распределения исследуемой случайной величин; об однородности двух или нескольких обрабатываемых выборок; о числовых значениях параметров исследуемой генеральной совокупности; об общем виде зависимости, существующей между компонентами исследуемого многомерного признака; о независимости и стационарности ряда наблюдений.
Все статистические критерии строятся по общей логической схеме. Построить статистический критерий - это значит: а) определить тип проверяемой гипотезы; б) предложить и обосновать конкретный вид функции от результатов наблюдения (критической статистики на основании значений которой принимается окончательное решение; в) указать такой способ выделения из области возможных значений критической статистики области отклонения проверяемой гипотезы Но, чтобы было соблюдено требование к величине вероятности ошибочного отклонения гипотезы Но (т.е. к уровню значимости критерия а).
1. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. - М.: ЮНИТИ, 1998.
2. Вентцель Е.С. Теория вероятностей. - М.: Высшая школа, 1998.
3. Эконометрика. /Под ред. Елисеевой И.И. - М.: Финансы и статистика, 2001.
Страницы: 1, 2, 3