Studijní materiály

Zpět

Hromadně přidat materiály

Texty k přednáškám statistiky od Nagyho a Kratochvílové

BA04 - Matematika III

Hodnocení materiálu:

Popisek: Texty k přednáškám statistiky od Nagyho a Kratochvílové (pravděpodobně jiná vysoká škola)

Zjednodušená ukázka:

Stáhnout celý tento materiál

i=1
Xi
#
= 1n
nX
i=1
E[Xi] = 1n
nX
i=1
„ = „
Vych¶ylen¶‡ bodov¶eho odhadu B( )2 je deflnov¶ano jako rozd¶‡l mezi st•redn¶‡ hodnotou
statistiky a odhadovan¶ym parametrem
B( ) = E(T)¡ (17)
Pozn¶amka: Z deflnice nevych¶ylenosti p•r¶‡mo plyne, •ze je-li statistika T pro odhad parametru
nevych¶ylen¶a, pak vych¶ylen¶‡ B( ) je nulov¶e.
Konzistence3
Definice 3.4 (Konzistence)
1Skripta str. 78
2Skripta str. 79
3Skripta str. 79
11
Statistika T d¶av¶a konzistentn¶‡ bodov¶y odhad parametru , jestli•ze pro rostouc¶‡ rozsah v¶yb•eru
se hodnota statistiky (v pravd•epodobnosti) neomezen•e bl¶‡•z¶‡ skute•cn¶emu parametru
limn!1P(jT ¡ j < †) = 1; 8† > 0 (18)
Koment¶a•r k deflnici
Tato vlastnost je limitn¶‡. Lze ji sledovat jen p•ri zv•et•suj¶‡c¶‡m se rozsahu v¶yb•eru { nap•r.
zm•e•r¶‡me 10 hodnot, pak 100, atd.
Tvrzen¶‡ 3.1 (Kriterium konzistence4)
Odhad je konzistentn¶‡, jestli•ze je
{ asymptoticky nestrann¶y,
{ jeho rozptyl jde k nule s rozsahem v¶yb•eru jdouc¶‡m k nekone•cnu.
Ov•e•ren¶‡: Plyne z pou•zit¶‡ •Ceby•sevovy nerovnosti pro obecn¶y odhad.
P•r¶‡klad: Ov•e•r¶‡me konzistenci v¶yb•erov¶eho pr”um•eru vzhledem k odhadu st•redn¶‡ hodnoty. Pro
d”ukaz vyu•zijeme •Ceby•sevovu nerovnost (??), kterou zap¶‡•seme pro v¶yb•erov¶a pr”um•er a st•redn¶‡ hodnotu
P(jX ¡„j < †) > 1¡
2
n†2
Proto•ze limn!1
2
n†2 = 0, je odhad konzistentn¶‡.
Vydatnost5
Definice 3.5 (Vydatnost)
Pro dv•e nestrann¶e statistiky T a U deflnujeme jako vydatn•ej•s¶‡ tu z nich, kter¶a m¶a men•s¶‡
rozptyl
D[T] < D[U] =) T je vydatn•ej•s¶‡ ne•z U (19)
Pozn¶amka: Pro posouzen¶‡ dvou statistik, kter¶e nejsou nestrann¶e, je t•reba zav¶est st•redn•e
kvadratickou chybu MSE6 deflnovanou vztahem
MSE = E[(T ¡ )2] = D[T]+(B( ))2 (20)
Jako vydatn•ej•s¶‡ deflnujeme statistiku s men•s¶‡ MSE. (Pro nestrann¶e statistiky MSE p•rech¶az¶‡ na
rozptyl a ob•e deflnice jsou shodn¶e.)
Ze vztahu pro MSE je patrn¶e, •ze v obecn¶em p•r¶‡pad•e tato charakteristika posuzuje jak rozptyl
odhadov¶e statistiky, tak i jej¶‡ vych¶ylen¶‡. MSE bude minim¶aln¶‡, jestli•ze bude minim¶aln¶‡ rozptyl i
vych¶ylen¶‡ statistiky.
5Skripta str. 80
6Skripta str. 80
12
3.4 Konstrukce bodov¶ych odhad”u (Skripta str. 82)
•Rekli jsme co je bodov¶y odhad a jak¶e u n•eho sledujeme vlastnosti. Nyn¶‡ se budeme v•enovat
ot¶azce, jak lze takov¶y odhad zkonstruovat. Uk¶a•zeme dv•e z¶akladn¶‡ metody pro konstrukci
statistiky, vhodn¶e pro odhad dan¶eho parametru.
Metoda moment”u7
Tato metoda je velmi jednoduch¶a, obecn•e v•sak ned¶av¶a p•r¶‡li•s kvalitn¶‡ v¶ysledky. Spo•c¶‡v¶a
v porovn¶an¶‡ obecn¶ych (nebo centr¶aln¶‡ch) moment”u souboru a v¶yb•eru. Podle toho, kolik
parametr”u odhadujeme, tolik moment”u mus¶‡me porovnat. Momenty souboru po•c¶‡t¶ame s po-
moc¶‡ hustoty pravd•epodobnosti souboru f(x; ). Budou tedy obsahovat nezn¶am¶y parametr .
V¶yb•er je mno•zina zm•e•ren¶ych hodnot. Moment v¶yb•eru bude tedy•c¶‡slo. Porovn¶an¶‡m moment”u
z¶‡sk¶ame rovnice kde nezn¶am¶e budou odhadovan¶e parametry. Z nich odhad vypo•cteme.
P•r¶‡klad: Budeme odhadovat nezn¶am¶y parametr – exponenci¶aln¶‡ho rozd•elen¶‡ s hustotou prav-
d•epodobnosti f(x;–) = –expf¡–xg; – > 0; x 2 (0;1) z v¶yb•eru x = [x1;x2;:::;xn].
Proto•ze odhadujeme jedin¶y parametr, sta•c¶‡ porovnat prvn¶‡ momenty, tj. st•redn¶‡ hodnotu souboru
(exponenci¶aln¶‡ho rozd•elen¶‡) a v¶yb•erov¶y pr”um•er zm•e•ren¶eho v¶yb•eru.
St•redn¶‡ hodnota souboru je
E[X] =
Z 1
0
xf(x;–)dx =
Z 1
0
x–expf¡–xgdx = 1=–:
V¶yb•erov¶y pr”um•er je
x = 1n
nX
i=1
xi = •c¶‡slo:
Porovn¶an¶‡m dostaneme 1
– = x )
^– = 1
x;
kde symbolem ^– jsme ozna•cili bodov¶y odhad parametru –.
Metoda maxim¶aln¶‡ v•erohodnosti8
Odhad pro obecn¶e rozd•elen¶‡
Tato metoda d¶av¶a velmi kvalitn¶‡ v¶ysledky a je •casto pou•z¶‡v¶ana. Pro norm¶aln¶‡ rozd•elen¶‡
souboru je ekvivalentn¶‡ s metodou nejmen•s¶‡ch •ctverc”u, o kter¶e budeme mluvit v regresn¶‡
anal¶yze. Metoda je zalo•zena na minimalizaci tzv. v•erohodnostn¶‡ funkce nebo jej¶‡m logaritmu
(co•z je tot¶e•z { pro•c?).
7Skripta str. 82
8Skripta str. 82
13
Definice 3.6 (V•erohodnostn¶‡ funkce)
Pro rozd•elen¶‡ s hustotou pravd•epodobnosti f(x; ) a realizaci n¶ahodn¶eho v¶yb•eru x =
[x1;x2;:::;xn] deflnujeme v•erohodnostn¶‡ funkci Ln( ) vztahem
Ln( ) =
nY
i=1
f(xi; ): (21)
Definice 3.7 (Maxim¶aln•e v•erohodn¶y odhad)
Maxim¶aln•e v•erohodn¶ym odhadem parametru rozd•elen¶‡ f(x; ) nazveme odhad ^ 2 ⁄,
kter¶y maximalizuje (logaritmus) v•erohodnostn¶‡ funkce, tj. plat¶‡
logLn(^ ) ‚ logLn( ); 8 2 ⁄ (22)
kde ⁄ ozna•cuje mno•zinu v•sech p•r¶‡pustn¶ych hodnot parametru .
Obecn¶y postup p•ri ur•cen¶‡ maxim¶aln•e v•erohodn¶eho odhadu je n¶asleduj¶‡c¶‡:
1. Sestav¶‡me v•erohodnostn¶‡ funkci tak, •ze n¶asob¶‡me hustoty pravd•epodobnosti souboru a
do ka•zd¶e dosad¶‡me za x jeden prvek v¶yb•eru xi.
2. Je-li to v¶yhodn¶e, v•erohodnostn¶‡ funkci logaritmujeme. Proto•ze •rada rozd•elen¶‡ m¶a
hustotu pravd•epodobnosti ve tvaru exponenci¶aly, b¶yv¶a logaritmus u•zite•cn¶y pro
zjednodu•sen¶‡ sou•cinu. Nen¶‡ v•sak nutn¶y.
3. Hled¶ame maximum logaritmu v•erohodnostn¶‡ funkce. V jednoduch¶em p•r¶‡pad•e nap•r.
pomoc¶‡ derivace, ve slo•zit•ej•s¶‡m p•r¶‡pad•e numericky.
Bod, kde le•z¶‡ maximum je maxim¶aln•e v•erohodn¶y odhad.
Odhad pro exponenci¶aln¶‡ t•r¶‡du rozd•elen¶‡
Definice 3.8 (Exponenci¶aln¶‡ t•r¶‡da rozd•elen¶‡)
•Rekneme, •ze hustota pravd•epodobnosti pat•r¶‡ do exponenci¶aln¶‡ t•r¶‡dy, jestli•ze je mo•zno ji
zapsat ve tvaru
f(x; ) = expfQ( )U(x)+R( )+V(x)g; (23)
kde Q;R jsou funkcemi jen (ne x) a U;V jsou funkcemi jen x (ne ).
P•r¶‡klad: Alternativn¶‡ rozd•elen¶‡ je z exponenci¶aln¶‡ t•r¶‡dy, nebot’ plat¶‡
f(x;…) = …x(1¡…)1¡x = expflog(…x(1¡…)1¡x)g =
= expfxlog(…)+(1¡x)log(1¡…)g = expf[log(…)¡log(1¡…)]x+log(1¡…)g:
Zde plat¶‡: Q = log(…)¡log(1¡…), U = x, R = log(1¡…), V = 0.
Je-li rozd•elen¶‡ z exponenci¶aln¶‡ t•r¶‡dy, dost¶av¶ame n¶asleduj¶‡c¶‡ jednoduch¶e •re•sen¶‡ ¶ulohy
maxim¶aln•e v•erohodn¶eho odhadu.
14
Tvrzen¶‡ 3.2 (Max. v•er. odhad pro exponenci¶aln¶‡ t•r¶‡du)
Prorozd•elen¶‡shustotoupravd•epodobnostif(x; ) = expfQ( )U(x)+R( )+V(x)garealizaci
v¶yb•eru x = [x1;x2;:::;xn] je extr¶em logaritmick¶e v•erohodnostn¶‡ funkce d¶an•re•sen¶‡m rovnice
Q0( )S(x)+nR0( ) = 0;
kde Q0;R0 jsou derivace podle a S(x) = Pni=1 U(xi).
Aby nalezen¶y extr¶em byl maximum, mus¶‡ b¶yt je•st•e spln•ena nerovnost
Q00( )S(x)+nR00 < 0:
Ov•e•ren¶‡: V•erohodnostn¶‡ funkce je
Ln( ) =
nY
i=1
expfQ( )U(xi)+R( )+V(xi)g = exp
( nX
i=1
(Q( )U(xi)+R( )+V(xi))
)
=
= exp
(
Q( )
nX
i=1
U(xi)+nR( )+
nX
i=1
V(xi)
)
:
Tento v¶yraz logaritmujeme a se zaveden¶ym zna•cen¶‡m dostaneme
logLn( ) = Q( )S(x)+nR( )+
nX
i=1
V(xi):
Po derivaci podle posledn¶‡ v¶yraz zmiz¶‡. Anulov¶an¶‡m derivace dost¶av¶ame podm¶‡nku pro
extr¶em. Podm¶‡nka pro maximum je z¶aporn¶a druh¶a derivace.
P•r¶‡klad: Metodou maxim¶aln¶‡ v•erohodnosti ur•cete odhadovou statistiku pro parametr … alterna-
tivn¶‡ho rozd•elen¶‡.
Uva•zujeme alternativn¶‡ rozd•elen¶‡, jeho•z exponenci¶aln¶‡ tvar jsme ji•z odvodili (viz p•r¶‡klad k (23)) a
zjistili jsme, •ze plat¶‡ Q = log(…=(1¡…)), U = x, R = log(1¡…), V = 0. Abychom mohli pou•z¶‡t
tvrzen¶‡ 3.2, pot•rebujeme je•st•e spo•c¶‡tat funkci S p•r¶‡slu•sn¶e derivace.
S = Pni=1 xi = nx, Q0 = 1…(1¡…), Q00 = ¡ 2…¡1…2(1¡…)2, R0 = ¡ 11¡…, R00 = ¡ 1(1¡…)2
Podm¶‡nka extr¶emu
Q0S +nR0 = 1…(1¡…)nx¡n 11¡… = 0 ) ^… = x
Podm¶‡nka maxima (s dosazen¶ym odhadem x = ^…)
¡ 2^… ¡1^…2(1¡ ^…)2n^… ¡n 1(1¡ ^…)2 < 0 ) ^… < 1
co•z je v•zdy spln•eno, nebot’ … = 1 je patologick¶y p•r¶‡pad.
15
4 Intervalov¶e odhady
4.1 Pojem intervalu spolehlivosti (Skripta str. 85)
Bodov¶e odhady poskytuj¶‡ hodnotu odhadu, ale ne•r¶‡kaj¶‡ nic o jeho p•resnosti. Ta je zahrnuta
v intervalu spolehlivosti - tj. intervalu, ve kter¶em le•z¶‡ nezn¶am¶y parametr s danou pravd•epo-
dobnost¶‡. P•resnost (nebo neur•citost) odhadu je d¶ana •s¶‡•rkou intervalu.
Z deflnice pravd•epodobnosti vypl¶yv¶a, •ze pravd•epodobnost parametru v dan¶em inter-
valu je asymptoticky rovna relativn¶‡ •cetnosti odhad”u, kter¶e padnou do tohoto intervalu
(p•ri opakovan¶ych v¶yb•erech). Proto lze interval spolehlivosti charakterizovat tak¶e jako in-
terval, do kter¶eho padne dan¶e procento odhad”u. Relativn¶‡ •cetnost odhad”u ur•cuje hustota
pravd•epodobnosti statistiky pro bodov¶y odhad. Ta je tak¶e z¶akladem pro ur•cen¶‡ intervalu
spolehlivosti.
Definice 4.1 (Interval spolehlivosti)
Interval Ifi = ( D; H) nazveme fi-interval spolehlivosti pro parametr , jestli•ze plat¶‡
P( 2 Ifi) = 1¡fi: (24)
Koment¶a•r k deflnici
1. Interval spolehlivosti budeme zkracovat IS.
2. Ifi se tak¶e naz¶yv¶a 100(1¡fi)-procentn¶‡ interval spolehlivosti, tj. 0:05-IS je 95% IS.
3. Pokud je¡1 < D a H < 1, tj. Ifije zdola i shora omezen¶y, hovo•r¶‡me o oboustrann¶em
IS. Je-li D = ¡1, tj. Ifi = (¡1; H), jedn¶a se o pravostrann¶y IS, pro H = 1, tj.
Ifi = ( D;1) jde o levostrann¶y IS.
P•r¶‡klad: Ur•cete 95% IS pro st•redn¶‡ hodnotu „ norm¶aln¶‡ho rozd•elen¶‡ s rozptylem 2 = 1 na
z¶aklad•e v¶yb•eru o rozsahu n = 100 s pr”um•erem x = 3:7.
Podle po•zadavk”u na IS mus¶‡ platit
P(„D < x < „H) = 1¡fi:
Normujeme
P(‡fi2 < x¡„ pn < zfi2 ) = 1¡fi
a v argumentu vyj¶ad•r¶‡me „ a pou•zijeme vztah ‡fi2 = ¡zfi2
¡zfi2 pn < x¡„ < zfi2 pn ) x¡zfi2 pn < „ < x+zfi2 pn:
Upravenou podm¶‡nku dosad¶‡me zp•et
P(x¡zfi2 pn < „ < x+zfi2 pn) = 1¡fi
16
Podle deflnice je IS
Ifi = (x¡zfi2 pn;x+zfi2 pn)
nebo p¶‡•seme
„ = x§zfi2 pn:
Na obr¶azku je hustota pravd•epodobnosti bodov¶eho odhadu, tj. v¶yb•erov¶eho pr”um•eru a na n¶‡ jsou
vyzna•ceny p•r¶‡slu•sn¶e pravd•epodobnosti, kvantil a kritick¶a hodnota.
‡fi2 zfi2
fi
2
fi
21¡fi
f(z)
Konkr¶etn•e:
fi = 0:05=2 = 0:025; x = 3:7; = 1; n = 100; zfi2 = 1:96 (z tabulek)
I0:05 = (3:7¡ 1101:96;3:7+ 1101:96) = (3:504;3:896)
4.2 Druhy interval”u spolehlivosti pro jednu n¶ahodnou veli•cinu
(Skripta str. 86-94)
Budeme uva•zovat n¶asleduj¶‡c¶‡ IS.
St•redn¶‡ hodnota (zn¶am¶e 2)9
Ifi : „ 2 x§ pnzfi=2; z » N(0;1)
†j†^ V programu Octave lze pro tento interval pou•z¶‡t funkci
is=z¡int(x,v,alpha,alt),
kde is je interval spolehlivosti, x je v¶yb•er, v je rozptyl souboru, alpha je
hladina v¶yznamnosti, alt typ testu (;)
9Skripta str. 86
17
St•redn¶‡ hodnota (nezn¶am¶e 2)10
Ifi : „ 2 x § spntfi=2; t » St(n¡1)
†j†^ V programu Octave lze pro tyto intervaly pou•z¶‡t funkci
is=t¡int(x,alpha,alt),
is=t¡int¡2s(x1,x2,alpha,alt),
is=t¡int¡2n(x1,x2,alpha,alt),
is=t¡int¡2p(x1,x2,alpha,alt),
kde is je interval spolehlivosti, x,x1,x2 v¶yb•er, alpha hladina v¶yznamnosti,
alt typ testu (;)
Rozptyl11
Ifi :
0
@(n¡1)s
2
´2fi=2 ;
(n¡1)s2
´21¡fi=2
1
A; ´2 » Chi2(n¡1)
†j†^ V programu Octave lze pro tento interval pou•z¶‡t funkci
is=var¡int(x,alpha,alt),
kde is je interval spolehlivosti, x v¶yb•er, alpha hladina v¶yznamnosti, alt typ
testu (;)
Pod¶‡l12
Ifi : … 2 p§
s
p(1¡p)
n zfi=2; z » N(0;1)
†j†^ V programu Octave lze pro tento interval pou•z¶‡t funkci
is=prop¡int(x,n,alpha,alt),
is=prop¡int¡2(x1,n1,x2,n2,alpha,alt),
kde is je interval spolehlivosti, x,x1,x2 je v¶yb•erov¶y pod¶‡l nebo po•cet, alpha hlad-
ina v¶yznamnosti, alt typ testu (;)
Dopln•ek k uveden¶ym interval”um:
10Skripta str. 89
11Skripta str. 90
12Skripta str. 92
18
v¶yb•erov¶y pr”um•er: x = 1n Pni=1 xi, v¶yb•erov¶y rozptyl: s2 = 1n¡1 Pni=1(xi ¡x)2,
v¶yb•erov¶y pod¶‡l: p = n+n , n+ je po•cet jedni•cek (¶usp•ech”u).
P•r¶‡klad: V jak¶em intervalu lze o•cek¶avat •zivotnost zakoupen¶e pneumatiky s pravd•epodobnost¶‡
0.95, jestli•ze pro 10 n¶ahodn•e vybran¶ych pneumatik byly zji•st•eny n¶asleduj¶‡c¶‡ •zivotnosti (v roc¶‡ch)
2 4 5 6 10 8 6 5 6 7.
P•r¶‡pravn¶e v¶ypo•cty:
x = 5:9; s = 2:183; t0:025(9) = 2:262
Interval:
I0:05 = (4:34; 7:46)
19
5 Parametrick¶e testy hypot¶ez
5.1 Pojem parametrick¶eho testu (Skripta str. 95-96)
Na z¶aklad•e v¶yb•eru srovn¶av¶ame dv•e tvrzen¶‡ o hodnot•e ur•cit¶eho parametru rozd•elen¶‡ f(x; ).
Prvn¶‡ tvrzen¶‡ (kter¶e v•et•sinou obhajuje st¶avaj¶‡c¶‡ stav v•ec¶‡) se naz¶yv¶a nulov¶a hypot¶eza a
zna•c¶‡ se H0, druh¶e tvrzen¶‡ (kter¶e v•et•sinou prosazuje, •ze v•eci se zm•enily) je alternativn¶‡
hypot¶eza ozna•cen¶a HA. Nulov¶a hypot¶eza n•eco tvrd¶‡: nap•r., •ze st•redn¶‡ hodnota „ je rovna „0
a alternativn¶‡ hypot¶eza ji odporuje. To m”u•ze m¶‡t t•ri r”uzn¶e podoby:
(25)hypot¶eza p•r¶‡kladI. parametr m¶a podle H
A v•et•s¶‡ hodnotu ne•z podle H0 „ > „0
II. parametr m¶a podle HA men•s¶‡ hodnotu ne•z podle H0 „ < „0
III. parametr se podle HA nerovn¶a hodnot•e parametru podle H0 „ 6= „0
Tvrzen¶‡ testujeme na z¶aklad•e testov¶e statistiky, kterou je statistika pro bodov¶y odhad
parametru podle H0. Pro parametrick¶e testy lze podstatu testov¶an¶‡ vylo•zit v souvislosti s IS
n¶asleduj¶‡c¶‡m zp”usobem (pro jednoduchost budeme uva•zovat test pro st•redn¶‡ hodnotu a se
zn¶am¶ym rozptylem souboru).
Nulov¶a hypot¶eza •r¶‡k¶a, •ze „ = „0. Jestli•ze je tato hypot¶eza pravdiv¶a a kolem bodu „0
sestroj¶‡mefiISatambystak¶espravd•epodobnost¶‡1¡fim•elpadnoutbodov¶yodhad,po•r¶‡zen¶y
z v¶yb•eru. Pokud tam padne, hypot¶ezu H0 nezam¶‡t¶ame { •rekneme, •ze data neprok¶azala jej¶‡
neplatnost. Pokud bodov¶y odhad padne mimo IS, hypot¶ezu H0 zam¶‡tneme. Jedin¶y (form¶aln¶‡)
rozd¶‡l test”u a interval”u je v tom, •ze p•ri intervalu pou•z¶‡v¶ame nenormovan¶y tvar statistiky,
nap•r. pro st•redn¶‡ hodnotu se zn¶am¶ym rozptylem je to v¶yb•erov¶y pr”um•er X, zat¶‡mco pro test
pou•zijeme normovan¶y v¶yb•erov¶y pr”um•er z = X¡„0 pn. Jeho realizaci ozna•c¶‡me zr.
Pozn¶amka: V•simn•ete si, •ze pro normov¶an¶‡ pou•zijeme „0, co•z je st•redn¶‡ hodnota podle nulov¶e
hypot¶ezy. Cel¶y test prob¶‡h¶a za platnosti H0, kter¶a bud’ d¶ale trv¶a, nebo je testem vyvr¶acena.
fi=2 fi=21¡fi
6IS z
r
f(zjH0)
5.2 Z¶akladn¶‡ pojmy (Skripta str. 97)
V p•redchoz¶‡m odstavci jsme dosti netradi•cn•e nast¶‡nili podstatu testov¶an¶‡ parametrick¶ych
hypot¶ez. Nyn¶‡ uvedeme z¶akladn¶‡ pojmy a postupy pro testov¶an¶‡ tak, jak je lze b•e•zn•e nal¶ezt
v u•cebnic¶‡ch klasick¶e statistiky. Pojmy budeme ihned demonstrovat na n¶asleduj¶‡c¶‡m p•r¶‡klad•e.
20
P•r¶‡klad: Z¶avod vyr¶ab¶‡ televizn¶‡ obrazovky u kter¶ych ud¶av¶a st•redn¶‡ •zivotnost 1200 h a rozptyl
•zivotnosti 900 h2. V¶yvojov¶e odd•elen¶‡ provedlo n•ekter¶e technologick¶e zm•eny p•ri v¶yrob•e a tvrd¶‡, •ze
•zivotnost nov•e vyroben¶ych obrazovek je v•et•s¶‡. Sv¶e tvrzen¶‡ dokl¶ad¶a v¶yb•erem 10 obrazovek z nov¶e s¶erie
pro n•e•z byla zji•st•ena pr”um•ern¶a •zivotnost 1216 h. Testujte H0 : "st•redn¶‡ •zivotnost obrazovek je 1200
hodin" na hladin•e v¶yznamnosti 0.05.
Nulov¶a hypot¶eza H0 je z¶akladn¶‡ hypot¶eza, kter¶a v•et•sinou potvrzuje st¶avaj¶‡c¶‡ stav.
[H0: st•redn¶‡ •zivotnost obrazovek je 1200 h.]
Alternativn¶‡ hypot¶eza HA je nov¶a hypot¶eza, kter¶a jedn¶‡m ze zp”usob”u (25) pop¶‡r¶a H0.
[HA: st•redn¶‡ •zivotnost obrazovek je v•et•s¶‡.]
Testov¶a statistika je normovan¶a statistika pro bodov¶y odhad testovan¶eho parametru.
[Zde se jedn¶a o st•redn¶‡ hodnotu, jej¶‡•z odhadov¶a statistika je v¶yb•erov¶y pr”um•er.]
D¶ale se jako parametr bude objevovat rozptyl se statistikou v¶yb•erov¶y rozptyl a pod¶‡l se
statistikou v¶yb•erov¶y pod¶‡l.
Hladina v¶yznamnosti fi je pravd•epodobnost fi z IS. Je to tzv. pravd•epodobnost I. druhu,
tj., •ze H0 bude zam¶‡tnuta, zat¶‡mco je ve skute•cnosti pravdiv¶a.
[V p•r¶‡kladu je fi = 0:05, co•z b¶yv¶a nej•cast•eji pou•z¶‡van¶a hodnota.]
Obor p•rijet¶‡ je mno•zina hodnot normovan¶e statistiky, kter¶a odpov¶‡d¶a IS. Pokud nor-
movan¶a statistika padne do oboru p•rijet¶‡, nen¶‡ H0 zam¶‡tnuta.
Kritick¶y obor W je mno•zina hodnot normovan¶e statistiky, kter¶a odpov¶‡d¶a dopl•nku IS.
Pokud normovan¶a statistika padne do kritick¶eho oboru, je H0 zam¶‡tnuta.
Pozn¶amka: Podle alternativn¶‡ hypot¶ezy HA pozn¶ame sm•erov¶an¶‡ testu.
pro W = (†;1) podle I. hovo•r¶‡me o pravostrann¶em testu;
pro W = (¡1;†) podle II. hovo•r¶‡me o levostrann¶em testu;
pro W = (¡1;†)[(†;1) podle III. hovo•r¶‡me o oboustrann¶em testu.
P•r¶‡klad: (pokra•cov¶an¶‡) Vypo•cteme p•r¶‡klad o televizn¶‡ch obrazovk¶ach.
Statistika pro odhad: x = 1216 (zad¶ano).
Hladina v¶yznamnosti: fi = 0:05 (zad¶ano).
Normovan¶a statistika: zr = x¡„0 pn = 1216¡1200p900 p10 = 1:687.
Obor p•rijet¶‡: dostaneme normov¶an¶‡m pravostrann¶eho IS, tj. (¡1; zfi) = (¡1; 1:645).
Kritick¶y obor: je dopl•nkem oboru p•rijet¶‡, tj. W = (1:645; 1).
Z¶av•er: z 2 W ) H0 zam¶‡t¶ame. Tedy, nen¶‡ pravda, •ze st•redn¶‡ •zivotnost obrazovek je 1200 hodin.
21
5.3 P-hodnota (Skripta str. 101-103)
Z p•redchoz¶‡ho p•r¶‡kladu je patrn¶e, •ze z klasick¶eho testu nepozn¶ame, "jak moc" H0 zam¶‡t¶ame
nebo "jak daleko" od zam¶‡tnut¶‡ se H0 nach¶az¶‡. Abychom tento nedostatek odstranili, a tak¶e
abychom v¶ysledek testu vyj¶ad•rili jedin¶ym •c¶‡slem, zav¶ad¶‡me p-hodnotu pv. Pro pravostrann¶y
test st•redn¶‡ hodnoty je p-hodnota deflnov¶ana vztahem
pv = P(Z > zrjH0); (26)
co•z je plocha pod hustotou pravd•epodobnosti normovan¶e statistiky, vpravo od realizovan¶e
statistiky.
fi=2 fi=21¡fi
6
pv
Wz
r
f(zjH0)
Z obr¶azku je patrn¶e, •ze:
¡ bude-li pv = fi, budeme na hranici zam¶‡tnut¶‡,
¡ pro pv < fi le•z¶‡ realizovan¶a statistika v kritick¶em oboru W, a tedy H0 zam¶‡t¶ame,
¡ pro pv > fi le•z¶‡ realizovan¶a statistika mimo kritick¶y obor W, a tedy H0 nezam¶‡t¶ame.
P•r¶‡klad: (pokra•cov¶an¶‡) K p•redchoz¶‡mu p•r¶‡kladu je•st•e dopo•cteme p-hodnotu:
pv = P(Z > 1:687) = 0:046:
Proto•ze pv < fi, hypot¶ezu H0 zam¶‡t¶ame.
5.4 Obecn¶e sch¶ema testu hypot¶ezy (Skripta str. 101)
Pro jednotliv¶e p•r¶‡pady z kapitoly 2 lze pou•z¶‡t obecn¶e schema:
Zn¶ame: zadan¶e a spo•cten¶e charakteristiky a konstanty.
Testov¶a statistika T: pou•zit¶a normovan¶a statistika a jej¶‡ rozd•elen¶‡ (vzorec - normovan¶y
podle H0).
Hodnota statistiky Tr: statistika s dosazen¶ym v¶yb•erem (vypo•cten¶e •c¶‡slo).
22
P-hodnota: spo•cteme pravd•epodobnost Pr = P(T < Tr)
(kvantil pro hodnotu statistiky - funkce xxx.cdf)
pv = 1¡Pr pro pravostrann¶y test, tj. 0 >
pv = Pr pro levostrann¶y test, tj. 0 <
pv = 2minfPr;1¡Prg pro oboustrann¶y test, tj. 0 6=
Z¶av•er: slovn¶‡ interpretace v¶ysledku.
P•r¶‡klad: (test pro dva pod¶‡ly) Na dvou pracovi•st¶‡ch A a B byly sledov¶any pracovn¶‡ prostoje.
Pracovi•st•e A bylo sledov¶ano v nA = 800 •casov¶ych okam•zic¶‡ch a bylo zaznamen¶ano n+A = 116 pros-
toj”u, zat¶‡mco pracovi•st•e B bylo sledov¶ano nB = 1200 kr¶at a zji•st•eno n+B = 138 prostoj”u. Na hladin•e
v¶yznamnosti fi = 0:05 testujte hypot¶ezu o rovnosti st•redn¶‡ch pod¶‡l”u prostoj”u na obou pracovi•st¶‡ch.
•Re•sen¶‡ provedeme podle uveden¶eho sch¶ematu:
Zn¶ame:
Hypot¶ezy: H0 : pA = pB, HA : pA 6= pB
Sm•erov¶an¶‡: oboustrann¶y test.
Pod¶‡ly:
pA = 116800 = 0:145; pB = 1381200 = 0:115; pP = p1(1¡p1)n
1 ¡1
+ p2(1¡p2)n
2 ¡1
= 2:410¡4
Hladina v¶yznamnosti: fi = 0:05
Testov¶a statistika:
z = p1 ¡p2pp
P
» N(0;1)
Hodnota statistiky: zr = 1:94
Kritick¶y obor W = (¡1:96;1:96)
P-hodnota: pv = 2£0:0265 = 0:053.
Z¶av•er: Na hladin•e 0.05 hypot¶ezu H0 nezam¶‡t¶ame, pod¶‡ly prostoj”u na pracovi•

Stáhnout celý tento materiál

Předchozí

1 2 3

Další

Vloženo: 26.08.2009

Velikost: 420,76 kB

Stáhnout celý tento materiál

Komentáře

Tento materiál neobsahuje žádné komentáře.

Mohlo by tě zajímat:

Skupina předmětu BA04 - Matematika III
Reference vyučujících předmětu BA04 - Matematika III

Podobné materiály