R²= ∑(y-y)²
Коэффициент детерминации- квадрат коэффициента или индекса корреляции.
F-mecm-оценивание качества уровнения регрессии- состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического
Fфакт и критического (табличного) Fтабл значений F критерия Фишера. Fфакт-
определяется из соотношения значений факторной и остаточной дисперсией, рассчитанных на одну степень свободы:
∑(ỹx-y)²/m r²xy
Fфакт= = (n-2)
∑(y-ỹ)² /(n-m-1) 1-r²xy
n- число едениц совокупности;
m- число параметров при переменных х.
Fтабл- это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а
Уровень значимости а вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл< Fфакт то Но – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл> Fфакт , то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
УСЛОВИЕ
По пяти городам известны значения 2х признаков: табл.№1
город
Средний доход сельхоз-хозяйств в %
Средний прирост КРС
Красноярск
72,8
47,1
Брянск
63,2
59,2
Армавир
61,9
50,2
Ростов
58,7
63,8
Киев
57,0
60,8
Требуется:
1) для характеристики зависимости у от х рассчитать параметры следующих функций (линейной, степенной, показательной, равносторонней гиперболы).
2) оценить каждую модель через среднюю ошибку аппроксимации А и F- критерии Фишера.
ЛИНЕЙНАЯ РЕГРЕССИВНАЯ МОДЕЛЬ
Для расчета параметров а и b линейной регрессии у=а+b∙x ,решаем систему нормальных уравнений относительно а и b:
n∙a+b∙∑x=∑y
yx- y∙x
a∙∑x+b∙∑x²=∑y∙x получаем b= σ²x
табл.№2
№п/п
у
х
ух
x²
y²
ŷx
у – ŷx
Аi
1
3428,88
2218,41
5299,84
68,87
3,93
5,30
2
3741,44
3504,64
3994,24
60,64
2,56
4,04
3
3107,38
2520,04
3831,61
66,76
-4,9
7,80
4
3745,06
4070,44
3445,69
57,51
1,13
1,90
5
3465,6
3696,64
3249
59,55
-2,55
4,47
Итого
313,6
281,1
17488,36
16010,17
19820,38
23,51
Среднее значение
62,72
56,22
3497,672
3202,034
3964,076
4,7
σ
5,5025
6,43
σ²
30,2776
41,34
Дисперсия получается, по формуле
σy²= n ∑(yi-y)²
σy²=3964.076-62.72²=30.2776
σх²=3202.034-56.22²=41.3456
ух-у∙х
b= σ²x =(3497,672-62,72∙56,22)/41,3456=0,68
а= у-b∙x=62,72+0,68∙56,22=100,9
уравнение регрессии ŷ=100,9-0,68х
ŷ1=100,9-0,68∙47,1=68,87
ŷ2=100,9-0,68∙59,2=60,64
ŷ3=100,9-0,68*50,2=66,76
ŷ4=100,9-0,68*63,8=57,51
ŷ5=100,9-0,68*60,8=59,55
Считаем линейный коэффициент парной корреляции
rху=b∙σx ∕ σy=0,68*6,43/5,5025=0,79 следовательно, связь сильная прямая
rху²=0.79²=0.62- коэффициент детерминации
Вариация результата на 62% объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ŷx и занесем их в таблицу. Найдем величину средней ошибки аппроксимации:
|yi-ŷxi|
Аi= yi *100%
А1=3,93/72,8*100%=5,3%
А2=2,56/63,2*100%=4,04%
А3=|-4,9| / 61,9*100%=7,8%
А4=1,13/58,7*100%=1,9%
А5=|-2,55| /57,0*100%=4,47%
В среднем расчетные значения отклоняются от фактических на 4,7%
По каждому наблюдению вычислим величину отклонения. Полученные данные занесем в таблицу
У1-ŷ1=72,8-68,87=3,93
У2-ŷ2=63,2-60,64=2,56
У3-ŷ3=61,9-66,76=-4,9
У4-ŷ4=58,7-57,57=1,13
У5-ŷ5=57,0-59,55=-2,55
Рассчитываем F критерий
Fфакт= = =0,62/(1-0,62)*(5-2)=4,89
∑(y-ỹ)² /(n-m-1) 1-r²xy (n-2)
т.к Fтабл.α=0,05 =10,13 следовательно Fтабл> Fфакт отсюда следует, что гипотеза Но принимается. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
ПОСТРОЕНИЕ СТЕПЕННОЙ РЕГРЕССИВНОЙ МОДЕЛИ
У=а*х предшествует процедура линеаризации переменных. Линеаризация производится путем логарифмирования обеих частей уравнения:
Lg y=lg a+b* lg x;
Y=C+b*X где
Y=lg y.,C= lg a., X= lg x
Табл.№3
№ п/п
Y
X
YX
Y²
X²
yi-ŷx
(yi-ŷx)²
Ai
1,86
1,67
3,1062
3,4596
2,7889
68,61
4,19
17,6
5,76
1,80
1,77
3,186
3,24
3,1329
60,24
2,96
8,76
4,68
1,79
1,70
3,043
3,2041
2,89
66,17
-4,27
18,23
6,90
57,72
0,98
0,96
1,76
1,78
3,1328
3,0976
3,1684
59,33
-2,33
5,43
4,09
8,98
8,72
15,654
16,134
15,22
50,98
23,1
Сред.знач
1,796
1,744
3,1308
3,22
3,044
10,196
4,62
0,3010
0,05
0,0906
0,0025
Страницы: 1, 2, 3