- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálZa´kladnı´ pojmy matematicke´ statistiky
Cı´l kapitoly
Po prostudova´nı´ te´to kapitoly budete
– rozumeˇt pojmu „na´hodny´ vy´beˇr“
– zna´t vlastnosti du˚lezˇity´ch statistik odvozeny´ch z na´hodne´ho vy´beˇru
– zna´t vlastnosti bodovy´ch a intervalovy´ch odhadu˚ parametru˚ a parametricky´ch
funkcı´
– umeˇt formulovat nulovou a alternativnı´ hypote´zu o parametru cˇi parametricke´
funkci
– zna´t trˇi zpu˚soby, jak testovat nulovou hypote´zu proti alternativnı´ hypote´ze
na dane´ hladineˇ vy´znamnosti
Cˇ asova´ za´teˇzˇ
Na prostudova´nı´ te´to kapitoly a splneˇnı´ u´kolu˚ s nı´ spojeny´ch budete potrˇebovat asi
18 hodin studia.
1.1 Motivace
Prˇi aplikaci metod popisne´ statistiky dospı´va´me pomocı´ zjisˇteˇny´ch dat k za´veˇru˚m,
ktere´ se ty´kajı´ pouze vy´beˇrove´ho souboru. Naproti tomu matematicka´ statistika
na´m umozˇnˇuje na za´kladeˇ znalosti na´hodne´ho vy´beˇru a statistik z neˇj odvozeny´ch
(tj. naprˇ. vy´beˇrove´ho pru˚meˇru, vy´beˇrove´ho rozptylu, vy´beˇrove´ho koeficientu kore-
lace, hodnoty vy´beˇrove´ distribucˇnı´ funkce apod.) ucˇinit za´veˇry o parametrech nebo
tvaru rozlozˇenı´, z neˇhozˇ dany´ na´hodny´ vy´beˇr pocha´zı´. Cˇasto se jedna´ o bodove´ cˇi
intervalove´ odhady parametru˚ a parametricky´ch funkcı´ a testova´nı´ hypote´z o nich.
1.2 Na´hodny´ vy´beˇr a statistiky odvozene´ z na´hodne´ho
vy´beˇru
1.2.1 Pojem na´hodne´ho vy´beˇru
Necht’X1,...,Xn jsou stochasticky neza´visle´ na´hodne´ velicˇiny, ktere´ majı´ vsˇechny
stejne´ rozlozˇenı´ L(ϑ). Rˇ ekneme, zˇe X1,...,Xn je na´hodny´ vy´beˇr rozsahu n z rozlo-
zˇenı´ L(ϑ). (Cˇı´selne´ realizace x1,...,xn na´hodne´ho vy´beˇru X1,...,Xn usporˇa´dane´ do
sloupcove´ho vektoru prˇedstavujı´ datovy´ soubor.)
Necht’(X1,Y1),...,(Xn,Yn) jsou stochasticky neza´visle´ dvourozmeˇrne´ na´hodne´ vek-
tory, ktere´ majı´ vsˇechny stejne´ dvourozmeˇrne´ rozlozˇenı´ L2(ϑ). Rˇ ekneme, zˇe
(X1,Y1),...,(Xn,Yn) je dvourozmeˇrny´ na´hodny´ vy´beˇr rozsahu n z dvourozmeˇr-
ne´ho rozlozˇenı´ L2(ϑ). (Cˇı´selne´ realizace (x1,y1),...,(xn,yn) na´hodne´ho vy´beˇru
(X1,Y1),...,(Xn,Yn) usporˇa´dane´ do matice typu n×2 prˇedstavujı´ dvourozmeˇrny´
datovy´ soubor.)
Analogicky lze definovat p-rozmeˇrny´ na´hodny´ vy´beˇr rozsahu n z p-rozmeˇrne´ho
rozlozˇenı´ Lp(ϑ).
16
1.2.2 Pojem statistiky, prˇı´klady du˚ lezˇity´ch statistik
Libovolna´ funkce T = T(X1,...,Xn) na´hodne´ho vy´beˇru X1,...,Xn (resp. p-rozmeˇr-
ne´ho na´hodne´ho vy´beˇru) se nazy´va´ statistika.
a) Necht’X1,...,Xn je na´hodny´ vy´beˇr, n ≥ 2.
Statistika M = 1n n∑
i=1
Xi se nazy´va´ vy´beˇrovy´ pru˚meˇr,
Statistika S2 = 1n−1 n∑
i=1
(Xi−M)2 vy´beˇrovy´ rozptyl,
Statistika S = √S2 vy´beˇrova´ smeˇrodatna´ odchylka.
Pro libovolne´, ale pevneˇ zvolene´ rea´lne´ cˇı´slo x je statistikou te´zˇ hodnota
vy´beˇrove´ distribucˇnı´ funkce
Fn(x) = 1n card{i; Xi ≤ x}.
b) Necht’ X11,...,X1n1,...,Xp1,...,Xpnp je p stochasticky neza´visly´ch na´hod-
ny´ch vy´beˇru˚ o rozsazı´ch n1 ≥ 2,...,np ≥ 2. Celkovy´ rozsah je n =
p
∑
j=1
n j.
Oznacˇme M1,...,Mp vy´beˇrove´ pru˚meˇry a S21,...,S2p vy´beˇrove´ rozptyly jed-
notlivy´ch vy´beˇru˚. Necht’c1,...,cp jsou rea´lne´ konstanty, asponˇ jedna nenu-
lova´.
Statistika
p
∑
j=1
c jMj se nazy´va´ linea´rnı´ kombinace vy´beˇrovy´ch pru˚meˇru˚.
Statistika S2∗ =
p
∑
j=1
(n j −1)S2j
n− p se nazy´va´ va´zˇeny´ pru˚meˇr vy´beˇrovy´ch rozptylu˚.
c) Necht’(X1,Y1),...,(Xn,Yn) je na´hodny´ vy´beˇr z dvourozmeˇrne´ho rozlozˇenı´.
Oznacˇme M1 = 1n n∑
i=1
Xi, M2 = 1n n∑
i=1
Yi.
Statistika S12 = 1n−1 n∑
i=1
(Xi−M1)(Yi−M2) je vy´beˇrova´ kovariance,
statistika
R12 =
1
n−1
n∑
i=1
Xi−M1
S1 ·
Yi −M2
S2 pro S1S2 negationslash= 0,
0 jinak.
vy´beˇrovy´ koeficient korelace.
(Cˇı´selne´ realizace m, s2, s, s12, r12 statistik M, S2, S, S12, R12 odpovı´dajı´ cˇı´selny´m
charakteristika´m znaku˚ v popisne´ statistice, ale u rozptylu, smeˇrodatne´ odchylky,
kovariance a koeficientu korelace je multiplikativnı´ konstanta 1n−1, nikoli 1n, jak
tomu bylo v popisne´ statistice.)
17
1. Za´kladnı´ pojmy matematicke´ statistiky
1.3 Bodove´ a intervalove´ odhady parametru˚
a parametricky´ch funkcı´
Vycha´zı´me z na´hodne´ho vy´beˇru X1,...,Xn z rozlozˇenı´ L(ϑ), ktere´ za´visı´ na parame-
tru ϑ. Mnozˇinu vsˇech prˇı´pustny´ch hodnot tohoto parametru oznacˇı´me Ξ. Parametr
ϑ nezna´me a chceme ho odhadnout pomocı´ dane´ho na´hodne´ho vy´beˇru (prˇı´padneˇ
chceme odhadnout neˇjakou parametrickou funkci h(ϑ)).
Bodovy´m odhadem parametricke´ funkce h(ϑ) je statistika Tn = T(X1,...,Xn), ktera´
naby´va´ hodnot blı´zky´ch h(ϑ), at’je hodnota parametru ϑ jaka´koliv. Existujı´ ru˚zne´
metody, jak konstruovat bodove´ odhady (naprˇ. metoda momentu˚ cˇi metoda maxi-
ma´lnı´ veˇrohodnosti, ale teˇmi se zde zaby´vat nebudeme) a take´ ru˚zne´ typy bodovy´ch
odhadu˚. Omezı´me se na odhady nestranne´, asymptoticky nestranne´ a konzistentnı´.
Intervalovy´m odhadem parametricke´ funkce h(ϑ) rozumı´me interval (D,H), jehozˇ
meze jsou statistiky D = D(X1,...,Xn), H = H(X1,...,Xn) a ktery´ s dostatecˇneˇ
velkou pravdeˇpodobnostı´ pokry´va´ h(ϑ), at’je hodnota parametru ϑ jaka´koliv.
1.3.1 Typy bodovy´ch odhadu˚
Necht’X1,...,Xn je na´hodny´ vy´beˇr z rozlozˇenı´ L(ϑ), h(ϑ) je parametricka´ funkce,
T,T1,T2,... jsou statistiky.
a) Rˇ ekneme, zˇe statistika T je nestranny´m odhadem parametricke´ funkce h(ϑ),
jestlizˇe
∀ϑ ∈ Ξ : E(T) = h(ϑ).
(Vy´znam nestrannosti spocˇı´va´ v tom, zˇe odhad T nesmı´ parametrickou
funkci h(ϑ) systematicky nadhodnocovat ani podhodnocovat. Nenı´-li tato
podmı´nka splneˇna, jde o vychy´leny´ odhad.)
b) Jsou-li T1, T2 nestranne´ odhady te´zˇe parametricke´ funkce h(ϑ), pak rˇekneme,
zˇe T1 je lepsˇı´ odhad nezˇ T2, jestlizˇe
∀ϑ ∈ Ξ : D(T1) < D(T2).
c) Posloupnost {Tn}BKn=1 se nazy´va´ posloupnost asymptoticky nestranny´ch od-
hadu˚ parametricke´ funkce h(ϑ), jestlizˇe
∀ϑ ∈ Ξ : limn→
BK
E(Tn) = h(ϑ).
(Vy´znam asymptoticke´ nestrannosti spocˇı´va´ v tom, zˇe s rostoucı´m rozsahem
vy´beˇru klesa´ vychy´lenı´ odhadu.)
d) Posloupnost {Tn}BKn=1 se nazy´va´ posloupnost konzistentnı´ch odhadu˚ parame-
tricke´ funkce h(ϑ), jestlizˇe
∀ϑ ∈ Ξ ∀ε > 0 : limn→
BK
Pparenleftbig|Tn−h(ϑ)|> εparenrightbig= 0.
(Vy´znam konzistence spocˇı´va´ v tom, zˇe s rostoucı´m rozsahem vy´beˇru klesa´
pravdeˇpodobnost, zˇe odhad se bude realizovat daleko od parametricke´ funkce
h(ϑ).)
18
Lze doka´zat, zˇe z nestrannosti odhadu vyply´va´ jeho asymptoticka´ nestrannost a
z asymptoticke´ nestrannosti vyply´va´ konzistence, pokud posloupnost rozptylu˚ od-
hadu konverguje k nule.
1.3.2 Vlastnosti du˚ lezˇity´ch statistik
a) Necht’X1,...,Xn je na´hodny´ vy´beˇr z rozlozˇenı´ se strˇednı´ hodnotou µ, roz-
ptylem σ2 a distribucˇnı´ funkcı´ Φ(x). Necht’ n ≥ 2. Oznacˇme Mn vy´beˇrovy´
pru˚meˇr, S2n vy´beˇrovy´ rozptyl a pro libovolne´, ale pevneˇ dane´ x ∈R Fn(x)
hodnotu vy´beˇrove´ distribucˇnı´ funkce.
Pak Mn je nestranny´m odhadem µ (tj. E(Mn) = µ) s rozptylem D(M) = σ
2
n ,S2
n je nestranny´m odhadem σ2 (tj. E(S2n)= σ2), at’jsou hodnoty parametru˚ µ,
σ2 jake´koli. Da´le platı´, zˇe pro libovolne´, ale pevneˇ dane´ x ∈R je vy´beˇrova´
distribucˇnı´ funkce Fn(x) nestranny´m odhadem Φ(x) (tj. E(Fn(x)) = Φ(x))
s rozptylem D(Fn(x)) = Φ(x)(1−Φ(x))/n, at’je hodnota distribucˇnı´ funkce
Φ(x) jaka´koliv.
Posloupnost {Mn}BKn=1 je posloupnost konzistentnı´ch odhadu˚ µ. braceleftbigS2nbracerightbigBKn=1 je
posloupnost konzistentnı´ch odhadu˚ σ2 . Pro libovolne´, ale pevneˇ dane´ x ∈R
je {Fn(x)}BKn=1 posloupnost konzistentnı´ch odhadu˚ Φ(x).
b) Necht’ X11,...,X1n1,...,Xp1,...,Xpnp je p stochasticky neza´visly´ch na´hod-
ny´ch vy´beˇru˚ o rozsazı´ch n1 ≥ 2,...,np ≥ 2 z rozlozˇenı´ se strˇednı´mi hodno-
tami µ1,...,µp a rozptylem σ2. Celkovy´ rozsah je n =
p
∑
j=1
n j. Necht’c1,...,cp
jsou rea´lne´ konstanty, asponˇ jedna nenulova´. Pak linea´rnı´ kombinace vy´beˇro-
vy´ch pru˚meˇru˚
p
∑
j=1
c jMj je nestranny´m odhadem linea´rnı´ kombinace strˇednı´ch
hodnot
p
∑
j=1
c jµ j, at’jsou strˇednı´ hodnoty µ1,...,µp jake´koli a va´zˇeny´ pru˚meˇr
vy´beˇrovy´ch rozptylu˚ S2∗ =
p
∑
j=1
(n j −1)S2j
n− p je nestranny´m odhadem rozptylu
σ2, at’je rozptyl σ2 jaky´koliv.
c) Necht’ (X1,Y1),...,(Xn,Yn) je na´hodny´ vy´beˇr z dvourozmeˇrne´ho rozlozˇenı´
s kovariancı´ σ12 a koeficientem korelace ρ. Pak vy´beˇrova´ kovariance S12 je
nestranny´m odhadem kovariance σ12, at’ je kovariance σ12 jaka´koli, avsˇak
E(R12) je rovno ρ pouze prˇiblizˇneˇ (shoda je vyhovujı´cı´ pro n > 30), at’ je
korelacˇnı´ koeficient ρ jaky´koli.
1.3.3 Pojem intervalu spolehlivosti
Necht’X1,...,Xn je na´hodny´ vy´beˇr z rozlozˇenı´ L(ϑ), h(ϑ) je parametricka´ funkce,
α ∈(0,1), D = D(X1,...,Xn), H = H(X1,...,Xn) jsou statistiky.
a) Interval (D,H) se nazy´va´ 100(1−α)% (oboustranny´) interval spolehlivosti
pro parametrickou funkci h(ϑ), jestlizˇe:∀ϑ ∈Ξ : P(D < h(ϑ)< H)≥1−α.
b) Interval (D,BK) se nazy´va´ 100(1−α)% levostranny´ interval spolehlivosti
pro parametrickou funkci h(ϑ), jestlizˇe: ∀ϑ ∈ Ξ : P(D < h(ϑ))≥ 1−α.
19
1. Za´kladnı´ pojmy matematicke´ statistiky
c) Interval (−BK,H) se nazy´va´ 100(1−α)% pravostranny´ interval spolehlivosti
pro parametrickou funkci h(ϑ), jestlizˇe: ∀ϑ ∈ Ξ : P(h(ϑ) < H)≥ 1−α.
d) Cˇı´slo α se nazy´va´ riziko (zpravidla α = 0,05, me´neˇ cˇasto 0,1 cˇi 0,01), cˇı´slo
1−α se nazy´va´ spolehlivost.
1.3.4 Postup prˇi konstrukci intervalu spolehlivosti
a) Vyjdeme ze statistiky V, ktera´ je nestranny´m bodovy´m odhadem paramet-
ricke´ funkce h(ϑ).
b) Najdeme tzv. pivotovou statistiku W , ktera´ vznikne transformacı´ statistiky
V , je monoto´nnı´ funkcı´ h(ϑ) a prˇitom jejı´ rozlozˇenı´ je zna´me´ a na h(ϑ)
neza´visı´. Pomocı´ zna´me´ho rozlozˇenı´ pivotove´ statistiky W najdeme kvantily
wα/2, w1−α/2 tak, zˇe platı´:
∀ϑ ∈ Ξ : Pparenleftbigwα/2 < W < w1−α/2parenrightbig≥ 1−α.
c) Nerovnost wα/2 < W < w1−α/2 prˇevedeme ekvivalentnı´mi u´pravami na ne-
rovnost
D < h(ϑ) < H.
d) Statistiky D, H nahradı´me jejich cˇı´selny´mi realizacemi d, h a zı´ska´me tak
100(1−α)% empiricky´ interval spolehlivosti, o neˇmzˇ prohla´sı´me, zˇe po-
kry´va´ h(ϑ) s pravdeˇpodobnostı´ asponˇ 1−α. (Tvrzenı´, zˇe (d,h) pokry´va´
h(ϑ) s pravdeˇpodobnostı´ asponˇ 1−α je trˇeba cha´pat takto: jestlizˇe mnoho-
na´sobneˇ neza´visle zı´ska´me realizace x1,...,xn na´hodne´ho vy´beˇru X1,...,Xn
z rozlozˇenı´ L(ϑ) a pomocı´ kazˇde´ te´to realizace sestrojı´me 100(1−α)% em-
piricky´ interval spolehlivosti pro h(ϑ), pak podı´l pocˇtu teˇch intervalu˚, ktere´
pokry´vajı´ h(ϑ) k pocˇtu vsˇech sestrojeny´ch intervalu˚ bude prˇiblizˇneˇ 1−α.)
1.3.5 Prˇı´klad
Necht’ X1,...,Xn je na´hodny´ vy´beˇr z N(µ,σ2), kde n ≥ 2 a rozptyl σ2 zna´me.
Sestrojte 100(1−α)% interval spolehlivosti pro nezna´mou strˇednı´ hodnotu µ.
Rˇ esˇenı´:
V tomto prˇı´padeˇ parametricka´ funkce h(ϑ) = µ. Nestranny´m odhadem strˇednı´
hodnoty je vy´beˇrovy´ pru˚meˇr (viz 1.3.2 (a)) M = 1n n∑
i=1
Xi. Protozˇe M je linea´rnı´
kombinacı´ norma´lneˇ rozlozˇeny´ch na´hodny´ch velicˇin, bude mı´t take´ norma´lnı´ roz-
lozˇenı´ se strˇednı´ hodnotou E(M) = µ a rozptylem D(M) = σ
2
n . Pivotovou statis-
tikou W bude standardizovana´ na´hodna´ velicˇina U = M−µσ√
n
∼ N(0,1). Kvantil
wα/2 = uα/2 = −u1−α/2, w1−α/2 = u1−α/2.
∀ϑ ∈ Ξ : 1−α ≤ P(−u1−α/2 < U < u1−α/2) =
P
parenleftBigg
−u1−α/2 < M−µσ√
n
< u1−α/2
parenrightBigg
= P
parenleftbigg
M− σ√nu1−α/2 < µ < M + σ√nu1−α/2
parenrightbigg
.
20
Meze 100(1−α)% intervalu spolehlivosti pro strˇednı´ hodnotu µ prˇi zna´me´m roz-
ptylu σ2 tedy jsou:
D = M− σ√nu1−α/2, H = M + σ√nu1−α/2.
Prˇi konstrukci jednostranny´ch intervalu˚ spolehlivosti se riziko nepu˚lı´, tedy
100(1 −α)% levostranny´ interval spolehlivosti pro µ je
parenleftbigg
M− σ√nu1−α,BK
parenrightbigg
a
pravostranny´ je
parenleftbigg
−BK,M + σ√nu1−α
parenrightbigg
.
Dosadı´me-li do vzorcu˚ pro dolnı´ a hornı´ mez cˇı´selnou realizaci m vy´beˇrove´ho
pru˚meˇru M, dostaneme 100(1−α)% empiricky´ interval spolehlivosti.
1.3.6 Sˇ ı´rˇka intervalu spolehlivosti
Necht’(d,h) je 100(1−α)% empiricky´ interval spolehlivosti pro h(ϑ) zkonstruo-
vany´ pomocı´ cˇı´selny´ch realizacı´ x1,...,xn na´hodne´ho vy´beˇru X1,...,Xn z rozlozˇenı´
L(ϑ).
a) Prˇi konstantnı´m riziku klesa´ sˇı´rˇka h–d s rostoucı´m rozsahem na´hodne´ho
vy´beˇru.
b) Prˇi konstantnı´m rozsahu na´hodne´ho vy´beˇru klesa´ sˇı´rˇka h–d s rostoucı´m
rizikem.
Za´vislost dolnı´ a hornı´ meze na rozsahu
vy´beˇru (prˇi konst. riziku)
Za´vislost dolnı´ a hornı´ meze na riziku (prˇi
konst. rozsahu vy´beˇru)
1.3.7 Prˇı´klad
Vyuzˇitı´ bodu 1.3.6 (a) prˇi stanovenı´ minima´lnı´ho rozsahu vy´beˇru z norma´lnı´ho
rozlozˇenı´: Necht’ X1,...,Xn je na´hodny´ vy´beˇr z N(µ,σ2), kde σ2 zna´me. Jaky´
musı´ by´t minima´lnı´ rozsah vy´beˇru n, aby sˇı´rˇka 100(1−α)% empiricke´ho intervalu
spolehlivosti pro strˇednı´ hodnotu µ neprˇesa´hla cˇı´slo ∆?
Rˇ esˇenı´:
Pozˇadujeme, aby ∆ ≥ h−d = m+ σ√nu1−α/2 −
parenleftbigg
m− σ√nu1−α/2
parenrightbigg
= 2σ√nu1−α/2.
21
1. Za´kladnı´ pojmy matematicke´ statistiky
Z te´to podmı´nky dostaneme, zˇe n≥
4σ2u21−α/2
∆2 . Za rozsah vy´beˇru zvolı´me nejmensˇı´prˇirozene´ cˇı´slo vyhovujı´cı´ te´to podmı´nce.
1.4 U´ vod do testova´nı´ hypote´z
Nulovou hypote´zou rozumı´me neˇjake´ tvrzenı´ o parametrech nebo typu rozlozˇenı´,
z neˇhozˇ pocha´zı´ na´hodny´ vy´beˇr. Nulova´ hypote´za vyjadrˇuje neˇjaky´ teoreticky´ prˇed-
poklad, cˇasto skepticke´ho ra´zu a uzˇivatel ji musı´ stanovit prˇedem, bez prˇihle´dnutı´
k datove´mu souboru. Proti nulove´ hypote´ze stavı´me alternativnı´ hypote´zu, ktera´
rˇı´ka´, co platı´, kdyzˇ neplatı´ nulova´ hypote´za. Naprˇ. nulova´ hypote´za tvrdı´, zˇe strˇednı´
hodnota hmotnosti balı´cˇku˚ cukru baleny´ch na automaticke´ lince se nezmeˇnila serˇı´ze-
nı´m automatu, zatı´mco alternativnı´ hypote´za tvrdı´ opak. Postup, ktery´ je zalozˇen na
dane´m na´hodne´m vy´beˇru a s jehozˇ pomocı´ rozhodneme o zamı´tnutı´ cˇi nezamı´tnutı´
nulove´ hypote´zy, se nazy´va´ testova´nı´ hypote´z.
1.4.1 Nulova´ a alternativnı´ hypote´za
Necht’X1,...,Xn je na´hodny´ vy´beˇr z rozlozˇenı´ L(ϑ), kde parametr ϑ ∈ Ξ nezna´me.
Necht’h(ϑ) je parametricka´ funkce a c dana´ rea´lna´ konstanta.
a) Oboustranna´ alternativa: Tvrzenı´ H0: h(ϑ)= c se nazy´va´ jednoducha´ nulova´
hypote´za. Proti nulove´ hypote´ze postavı´me slozˇenou alternativnı´ hypote´zu
H1: h(ϑ)negationslash= c.
b) Levostranna´ alternativa: Tvrzenı´ H0: h(ϑ) ≥ c se nazy´va´ slozˇena´ pravo-
stranna´ nulova´ hypote´za. Proti jednoduche´ nebo slozˇene´ pravostranne´ nu-
love´ hypote´ze postavı´me slozˇenou levostrannou alternativnı´ hypote´zu H1:
h(ϑ) < c.
c) Pravostranna´ alternativa: Tvrzenı´H0: h(ϑ)≤c se nazy´va´ slozˇena´ levostranna´
nulova´ hypote´za. Proti jednoduche´ nebo slozˇene´ levostranne´ nulove´ hypote´ze
postavı´me slozˇenou pravostrannou alternativnı´ hypote´zu H1: h(ϑ) > c.
Testova´nı´m H0 proti H1 rozumı´me rozhodovacı´ postup zalozˇeny´ na na´hodne´m vy´-
beˇru X1,...,Xn, s jehozˇ pomocı´ zamı´tneme cˇi nezamı´tneme platnost nulove´ hypo-
te´zy.
1.4.2 Chyba 1. a 2. druhu
Prˇi testova´nı´ H0 proti H1 se mu˚zˇeme dopustit jedne´ ze dvou chyb: chyba 1. druhu
spocˇı´va´ v tom, zˇe H0 zamı´tneme, acˇ ve skutecˇnosti platı´ a chyba 2. druhu spocˇı´va´
v tom, zˇe H0 nezamı´tneme, acˇ ve skutecˇnosti neplatı´. Situaci prˇehledneˇ zna´zornˇuje
tabulka:
skutecˇnost rozhodnutı´
H0 nezamı´ta´me H0 zamı´ta´me
H0 platı´ spra´vne´ rozhodnutı´ chyba 1. druhu
H0 neplatı´ chyba 2. druhu spra´vne´ rozhodnutı´
22
Pravdeˇpodobnost chyby 1. druhu se znacˇı´ α a nazy´va´ se hladina vy´znamnosti testu
(veˇtsˇinou by´va´ α = 0,05, me´neˇ cˇasto 0,1 cˇi 0,01). Pravdeˇpodobnost chyby 2. druhu
se znacˇı´ β. Cˇı´slo 1−β se nazy´va´ sı´la testu a vyjadrˇuje pravdeˇpodobnost, s jakou
test vypovı´, zˇe H0 neplatı´.
1.4.3 Testova´nı´ pomocı´ kriticke´ho oboru
Najdeme statistiku T0 = T0(X1,...,Xn), kterou nazveme testovy´m krite´riem (tes-
tovou statistikou). Mnozˇina vsˇech hodnot, jichzˇ mu˚zˇe testove´ krite´rium naby´t, se
rozpada´ na obor nezamı´tnutı´ nulove´ hypote´zy (znacˇı´ se V) a obor zamı´tnutı´ nulove´
hypote´zy (znacˇı´ se W a nazy´va´ se te´zˇ kriticky´ obor). Tyto dva obory jsou oddeˇleny
kriticky´mi hodnotami (pro danou hladinu vy´znamnosti α je lze najı´t ve statisticky´ch
tabulka´ch).
Jestlizˇe cˇı´selna´ realizace t0 testove´ho krite´ria T0 padne do kriticke´ho oboru W,
pak nulovou hypote´zu zamı´ta´me na hladineˇ vy´znamnosti α a znamena´ to skutecˇne´
vyvra´cenı´ testovane´ hypote´zy. Jestlizˇe t0 padne do oboru nezamı´tnutı´ V, pak jde
o pouhe´ mlcˇenı´, ktere´ platnost nulove´ hypote´zy jenom prˇipousˇtı´.
Pravdeˇpodobnosti chyb 1. a 2. druhu nynı´ zapı´sˇeme takto:
P(T0 ∈W/H0 platı´) = α, P(T0 ∈V/H1 platı´) = β.
Stanovenı´ kriticke´ho oboru pro danou hladinu vy´znamnosti α:
Oznacˇme tmin (resp. tmax) nejmensˇı´ (resp. nejveˇtsˇı´) hodnotu testove´ho krite´ria. Kri-
ticky´ obor v prˇı´padeˇ oboustranne´ alternativy ma´ tvar
W = (tmin,Kα/2(T)〉∪〈K1−α/2(T),tmax),
kde Kα/2(T) a K1−α/2(T) jsou kvantily rozlozˇenı´, jı´mzˇ se rˇı´dı´ testove´ krite´rium T0,
je-li nulova´ hypote´za pravdiva´.
Kriticky´ obor v prˇı´padeˇ levostranne´ alternativy ma´ tvar:
W = (tmin,Kα(T)〉.
Kriticky´ obor v prˇı´padeˇ pravostranne´ alternativy ma´ tvar:
W = 〈K1−α(T),tmax).
Doporucˇuje se dodrzˇovat na´sledujı´cı´ postup:
– Stanovı´me nulovou hypote´zu a alternativnı´ hypote´zu. Prˇitom je vhodne´ zvolit
jako alternativnı´ hypote´zu ten prˇedpoklad, jehozˇ prˇijetı´ znamena´ za´vazˇne´
opatrˇenı´ a meˇlo by k neˇmu dojı´t jen s maly´m rizikem omylu.
– Zvolı´me hladinu vy´znamnosti α. Zpravidla volı´me α = 0,05, me´neˇ cˇasto 0,1
nebo 0,01.
– Najdeme vhodne´ testove´ krite´rium a na za´kladeˇ zjisˇteˇny´ch dat vypocˇı´ta´me
jeho realizaci.
– Stanovı´me kriticky´ obor.
23
1. Za´kladnı´ pojmy matematicke´ statistiky
– Jestlizˇe realizace testove´ho krite´ria padla do kriticke´ho oboru, nulovou hy-
pote´zu zamı´ta´me na hladineˇ vy´znamnosti α. V opacˇne´m prˇı´padeˇ nulovou
hypote´zu nezamı´ta´me na hladineˇ vy´znamnosti α.
1.4.4 Testova´nı´ pomocı´ intervalu spolehlivosti
Sestrojı´me 100(1−α)% empiricky´ interval spolehlivosti pro parametrickou funkci
h(ϑ). Pokryje-li tento interval hodnotu c, pak H0 nezamı´ta´me na hladineˇ vy´znam-
nosti α, v opacˇne´m prˇı´padeˇ H0 zamı´ta´me na hladineˇ vy´znamnosti α.
Pro test H0 proti oboustranne´ alternativeˇ sestrojı´me oboustranny´ interval
spolehlivosti.
Pro test H0 proti levostranne´ alternativeˇ sestrojı´me pravostranny´ interval
spolehlivosti.
Pro test H0 proti pravostranne´ alternativeˇ sestrojı´me levostranny´ interval
spolehlivosti.
1.4.5 Testova´nı´ pomocı´ p-hodnoty
p-hodnota uda´va´ nejnizˇsˇı´ mozˇnou hladinu vy´znamnosti pro zamı´tnutı´ nulove´ hy-
pote´zy. Je-li p-hodnota ≤ α, pak H0 zamı´ta´me na hladineˇ vy´znamnosti α, je-li
p-hodnota > α, pak H0 nezamı´ta´me na hladineˇ vy´znamnosti α.
Zpu˚sob vy´pocˇtu p-hodnoty:
Pro oboustrannou alternativu p = 2min{P(T0 ≤ t0),P(T0 ≥ t0)}.
Pro levostrannou alternativu p = P(T0 ≤ t0).
Pro pravostrannou alternativu p = P(T0 ≥ t0).
p-hodnota vyjadrˇuje pravdeˇpodobnost, s jakou cˇı´selne´ realizace x1,...,xn na´hod-
ne´ho vy´beˇru X1,...,Xn podporujı´ H0, je-li pravdiva´. Statisticke´ programove´ syste´my
poskytujı´ ve svy´ch vy´stupech p-hodnotu. Jejı´ vy´pocˇet vyzˇaduje znalost distribucˇnı´
funkce rozlozˇenı´, ktery´m se rˇı´dı´ testove´ krite´rium T0, je-li H0
Vloženo: 26.04.2009
Velikost: 5,47 MB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu PMSTII - Statistika II
Reference vyučujících předmětu PMSTII - Statistika II
Podobné materiály
- PEMAKI - Makroekonomie I - Distanční studijní opora
- PEMIKI - Mikroekonomie I - Distanční studijní opora
- PESHOS - Světové hospodářství - Distanční studijní opora
- PFBAMA - Bankovní management - Distanční studijní opora
- PFFUI - Finanční účetnictví I - Distanční studijní opora
- PFZFIF - Základy firemních financí - Distanční studijní opora
- PHFIMAN - Finanční management - Distanční studijní opora
- PHNOPI - Nauka o podniku I - Distanční studijní opora
- PHNPII - Nauka o podniku II - Distanční studijní opora
- PHPCHE - Psychologie pro ekonomy - Distanční studijní opora
- PHZAFI - Základy filozofie - Distanční studijní opora
- PMMAT2 - Matematika II - Distanční studijní opora
- PMMATI - Matematika I - Distanční studijní opora
- PMSTAI - Statistika I - Distanční studijní opora
- PPOPRI - Obchodní právo I - Distanční studijní opora
- PPPRP - Pracovní právo - Distanční studijní opora
- PPSP - Správní právo - Distanční studijní opora
- PRCERU - Cestovní ruch - Distanční studijní opora
- PRDEMO - Demografie - Distanční studijní opora
- PREG - Ekonomická geografie - Distanční studijní opora
- PREUAE - Evropská unie a euroregiony - Distanční studijní opora
- PVSOCI - Sociologie pro ekonomy - Distanční studijní opora
- PVZAPO - Základy politologie - Distanční studijní opora
- PFBANI - Bankovnictví I - Distanční studijní opora
- PFBRAD - Bankovní regulace a dohled - Distanční studijní opora
- PHFIMAN - Finanční management - Distanční studijní opora
- PHMARI - Marketing I - Distanční studijní opora
- PVSOCI - Sociologie pro ekonomy - Studijní material_sociologie
- KFBAII - Bankovnictví II - Distaanční studijní opora
Copyright 2025 unium.cz


