- Stahuj zápisky z přednášek a ostatní studijní materiály
- Zapisuj si jen kvalitní vyučující (obsáhlá databáze referencí)
- Nastav si své předměty a buď stále v obraze
- Zapoj se svojí aktivitou do soutěže o ceny
- Založ si svůj profil, aby tě tví spolužáci mohli najít
- Najdi své přátele podle místa kde bydlíš nebo školy kterou studuješ
- Diskutuj ve skupinách o tématech, které tě zajímají
Studijní materiály
Zjednodušená ukázka:
Stáhnout celý tento materiálKapitola 1
Z¶aklady popisn¶e statistiky
V•sude kolem n¶as se setk¶av¶ame se shroma•zd’ov¶an¶‡m velk¶eho po•ctu ¶udaj”u o nejr”uzn•ej-
•s¶‡ch objektech. Mohou to b¶yt n¶arodohospod¶a•rsk¶e ¶udaje o v¶yvoji ekonomiky dan¶e
zem•e sb¶‡ran¶e v pravideln¶ych •casov¶ych intervalech, ¶udaje o klientech dan¶e banky,
¶udaje o p•r¶‡jmech a v¶ydaj¶‡ch poji•st’ovny, ¶udaje o zdravotn¶‡m stavu pacient”u o•set•re-
n¶ych ve vybran¶e nemocnici, person¶aln¶‡ ¶udaje o studentech a ¶udaje o jejich prosp•echu
na ur•cit¶e univerzit•e v dan¶em roce, ¶udaje o v¶yrobc¶‡ch dan¶eho podniku a podobn•e.
Souhrnn•e, tyto ¶udaje vytv¶a•rej¶‡ rozs¶ahl¶e datov¶e soubory, kter¶e obsahuj¶‡ velk¶e mno•zst-
v¶‡ informace. Informace obsa•zen¶a v takov¶ych rozs¶ahl¶ych datov¶ych souborech se m”u•ze
lidsk¶emu pozorovateli jevit jako nep•rehledn¶a a pro jej¶‡ ut•r¶‡d•en¶‡ se zav¶ad¶‡ speci¶aln¶‡
apar¶at { popisn¶a statistika. C¶‡lem popisn¶e statistiky je informaci z datov¶ych sou-
bor”u zhu•st•en•e a p•rehledn•e popsat tak, aby byla snadn•eji vn¶‡mateln¶a. K p•rehledn¶emu
popisu rozs¶ahl¶ych datov¶ych soubor”u se v popisn¶e statistice •casto pou•z¶‡vaj¶‡ r”uzn¶e
typy tabulek, graf”u, diagram”u a r”uzn¶e funkcion¶aln¶‡ charakteristiky jednodu•se stano-
ven¶e pomoc¶‡ element¶arn¶‡ch matematick¶ych prost•redk”u. Uk¶azat z¶akladn¶‡ metody po-
pisn¶e statistiky je c¶‡lem t¶eto kapitoly.
1.1 Z¶akladn¶‡ pojmy
Datov¶e soubory obvykle po•rizujeme pozorov¶an¶‡m, m•e•ren¶‡m, nebo jin¶ym zji•st’ov¶an¶‡m
hodnoty sledovan¶eho ukazatele •ci prom•enn¶e na mno•zin•e k tomu ¶u•celu vybran¶ych
prvk”u. Tyto prvky naz¶yv¶ame statistick¶e jednotky a jejich mno•zinu, kter¶a je
p•redm•etem prov¶ad•en¶eho sledov¶an¶‡ naz¶yv¶ame statistick¶y soubor. Statistick¶y sou-
bor je obvykle dob•re vymezen z hlediska v•ecn¶eho, prostorov¶eho a•casov¶eho. Nap•r. p•ri
pr”uzkumu n¶azor”u student”u na placen¶‡ •skoln¶eho m”u•ze b¶yt statistick¶y soubor tvo•ren
v•semi studenty studuj¶‡c¶‡mi prvn¶‡ ro•cn¶‡k Masarykovy univerzity v Brn•e v roce 2005.
Vymezen¶‡ statistick¶eho souboru mus¶‡ b¶yt jednozna•cn¶e a nem•ely by vznikat pochyb-
nosti, zda dan¶y prvek do statistick¶eho souboru pat•r¶‡ •ci nikoliv. V uveden¶em p•r¶‡klad•e
1
2
by tedy m•elo b¶yt•re•ceno, zda se soubor vztahuje tak¶e na studenty distan•cn¶‡ho studia
nebo jenom na studenta •r¶adn¶eho studia apod. Zji•st’ovan¶y ukazatel, kter¶y na jednot-
liv¶ychprvc¶‡chstatistick¶ehosouborupozorujeme nebom•e•r¶‡me,senaz¶yv¶astatistick¶y
znak. Statistick¶e znaky budeme ozna•covat velk¶ymi p¶‡smeny z konce abecedy, nap•r.
X m”u•ze b¶yt na v¶y•se zm¶‡n•en¶em souboru ukazatel "n¶azor na placen¶‡ •skoln¶eho", Y
m”u•ze b¶yt "flnan•cn¶‡ situace jeho rodiny" zak¶odovan¶a n¶asleduj¶‡c¶‡m zp”usobem: 1 {
v¶yborn¶a, 2 { dobr¶a, 3 { uspokojiv¶a, 4 { neuspokojiv¶a; Z m”u•ze b¶yt "m•es¶‡•cn¶‡ v¶y•se
kapesn¶eho v 1000 K•c" apod.
Na p•r¶‡kladu p•redchoz¶‡ch t•r¶‡ znak”u X, Y a Z je dob•re patrn¶e, •ze se tyto znaky od
sebe sv¶ym charakterem mohou zna•cn•e li•sit. Zat¶‡mco znak X m”u•ze nab¶yvat pouze
3 hodnot z mno•ziny f1;2;3g a znak Y m”u•ze nab¶yvat pouze •cty•r hodnot z mno•ziny
f1;2;3;4g, m”u•ze znak Z nab¶yvat p•ri dostate•cn•e p•resn¶em sledov¶an¶‡ znaku, kter¶ekoliv
hodnoty v intervalu (0;1). (P•r¶‡li•s vysok¶ych hodnot nab¶yv¶a prakticky s nulovou
pravd•epodobnost¶‡.) Mo•zn¶e hodnoty znaku se naz¶yvaj¶‡ varianty, nebo t¶e•z obm•eny
znaku a tvo•r¶‡ mno•zinu, kterou ozna•c¶‡me V. Je-li mno•zina V kone•cn¶a, nebo spo•cetn¶a
(tj. jej¶‡ prvky lze uspo•r¶adat do posloupnosti), mluv¶‡me o diskr¶etn¶‡m znaku. Je-li
mno•zina variant diskr¶etn¶‡ho znaku X kone•cn¶a, ozna•c¶‡me je Vx = fx[1];x[2];:::;x[r]g.
•C¶‡slo r je po•cet mo•zn¶ych variant diskr¶etn¶‡ho znaku X. V opa•cn¶em p•r¶‡pad•e, kdy•z je
mno•zina V tvo•rena intervalem, mluv¶‡me o spojit¶em znaku. V uveden¶em p•r¶‡klad•e
jsou tedy znaky X a Y diskr¶etn¶‡ a znak Z je spojit¶y.
Jin¶e d•elen¶‡ znak”u dostaneme podle stupn•e jejich kvantiflkace. Vyjdeme ze statis-
tick¶eho souboru, kter¶y obsahuje n statistick¶ych jednotek. •C¶‡slo n budeme naz¶yvat
rozsahem statistick¶eho souboru a hodnoty znaku X zji•st•en¶e na jednotliv¶ych
statistick¶ych jednotk¶ach ozna•c¶‡me x1;x2;:::;xn. Potom podle obsahov¶e kvantiflkace
hodnot znaku rozd•elujeme znaky na:
a) nomin¶aln¶‡, kter¶e p•ripou•st•ej¶‡ mezi hodnotami x1;x2;:::;xn pouze relaci rov-
nosti, nap•r. x1 = x2;x2 6= x3 apod. Jednotliv¶e hodnoty znak”u p•redstavuj¶‡
pouze •c¶‡seln¶e k¶ody kvalitativn¶‡ch pojmenov¶an¶‡. Nap•r. znak X { n¶azor na
placen¶‡ •skoln¶eho je nomin¶aln¶‡ znak. Jin¶ym p•r¶‡kladem m”u•ze b¶yt o•c¶‡slov¶an¶‡
m•estsk¶ych tramvaj¶‡, zak¶odov¶an¶‡ profese zam•estnance apod. Nomin¶aln¶‡ znak,
kter¶y m”u•ze nab¶yvat pouze dvou hodnot se naz¶yv¶a alternativn¶‡ v opa•cn¶em
p•r¶‡pad•e mno•zinn¶y.
b) ordin¶aln¶‡, kter¶e p•ripou•st•ej¶‡ krom•e relace rovnosti tak¶e obsahovou interpretaci
relace uspo•r¶ad¶an¶‡ x1 < x2 (nebo x1 > x2). Uspo•r¶ad¶an¶‡ vyjad•ruje v•et•s¶‡ nebo
men•s¶‡ intenzitu popisovan¶e vlastnosti. Nap•r. znak Y je ordin¶aln¶‡, pro hodnoty
znaku y1 = 1;y2 = 3 a y3 = 1 plat¶‡,•ze prvn¶‡ a t•ret¶‡ student uva•zovan¶eho statis-
tick¶eho souboru maj¶‡ stejn•e ohodnocenou flnan•cn¶‡ situaci rodiny, ale flnan•cn¶‡
situace rodiny prvn¶‡ho studenta je lep•s¶‡ ne•z flnan•cn¶‡ situace rodiny druh¶eho
studenta (y1 = y3, ale y1 < y2).
c) kardin¶aln¶‡ znaky p•ripou•st•ej¶‡ obsahovou interpretaci nejen relac¶‡ rovnosti a
3
uspo•r¶ad¶an¶‡ ale tak¶e operac¶‡ sou•ctu x1 +x2 a rozd¶‡lu x1 ¡x2. To znamen¶a, •ze
v p•r¶‡pad•e kdy x1¡x2 = x2¡x3, je interval (x2;x1) stejn•e dlouh¶y jako interval
(x3;x2) a tato stejn¶a d¶elka obou interval”u p•redstavuje u obou dvojic x1;x2
a x2;x3 tak¶e stejn¶y rozd¶‡l v extenzit•e zkouman¶e vlastnosti. Nap•r. znak Z {
m•es¶‡•cn¶‡ v¶y•se kapesn¶eho studenta je kardin¶aln¶‡ znak, je-li z1 = 1:8, z2 = 2 a
z3 = 2:2, je stejn¶y rozd¶‡l mezi kapesn¶ym student”u 2 a 1 jako mezi kapesn¶ym
student”u 3 a 2.
M¶a-li u kardin¶aln¶‡ho znaku smysluplnou obsahovou interpretaci tak¶e operace
pod¶‡lu, tj. x1=x2, pak se kardin¶aln¶‡ znak naz¶yv¶a pom•erov¶y. V p•r¶‡pad•e, •ze
operace pod¶‡lu nem¶a smysluplnou obsahovou interpretaci, naz¶yv¶a se tento kar-
din¶aln¶‡ znak intervalov¶y. P•r¶‡kladem pom•erov¶eho znaku je znak Z { m•es¶‡•cn¶‡
v¶y•se kapesn¶eho studenta, kdy pro z1 = 3:2 a z2 = 6:4 lze smyslupln•e prohl¶asit,
•ze druh¶y student dost¶av¶a 2x vy•s•s¶‡ kapesn¶e n•e•z prvn¶‡. P•r¶‡kladem intervalov¶eho
znaku m”u•ze b¶yt nap•r. teplota m•e•ren¶a ve stupn¶‡ch Celsia, kde nula na dan¶e
stupnici vznikla pouhou konvenc¶‡. Lze proto u teploty nam•e•ren¶e ve t•rech dnech
ve stupn¶‡ch Celsia t1 = 2;t2 = 4;t3 = 6 •r¶‡ci, •ze z prvn¶‡ho na druh¶y den teplota
vzrostla o 2 stupn•e Celsia a •ze rovn•e•z ze druh¶eho na t•ret¶‡ den teplota vzrostla
o 2 stupn•e Celsia. Chybn¶a interpretace t•echto ¶udaj”u by byla, kdybychom•rekli,
•ze teplota z prvn¶‡ho na druh¶y den vzrostla dvakr¶at, kde•zto ze druh¶eho na t•ret¶‡
den pouze jedenap”ulkr¶at.
1.2 Rozd•elen¶‡ •cetnost¶‡ statistick¶eho znaku
Budeme uva•zovat statistick¶y znak X, kter¶y na dan¶em statistick¶em souboru nabyl
hodnot x1;x2;:::;xn. P•redpokl¶adejme, •ze mno•zina jeho variant je kone•cn¶a, tedy
VX = fx[1];x[2];:::;x[r]g. Pak zavedeme n¶asleduj¶‡c¶‡ pojmy:
nj ::: absolutn¶‡ •cetnost varianty x[j] v dan¶em souboru
pj = nj=n ::: relativn¶‡ •cetnost varianty x[j] v dan¶em souboru
Je-li znak X ordin¶aln¶‡ nebo kardin¶aln¶‡ a varianty x[j] lze uspo•r¶adat, tj. kdy•z x[1] <
x[2] < ::: < x[r] m”u•zeme zav¶est kumulativn¶‡ •cetnosti
Nj = Pji=1 ni ::: absolutn¶‡ kumulativn¶‡ •cetnost do varianty x[j] v dan¶em souboru
Pj = Pji=1 pi ::: relativn¶‡ kumulativn¶‡ •cetnost varianty x[j] v dan¶em souboru
Uveden¶e •cetnosti lze uspo•r¶adat do tabulky, kter¶a m¶a 3 nebo 5 sloupc”u podle typu
znaku.
Tabulka Tab.1.1 zhu•st•en•e popisuje na dan¶em statistick¶em souboru nam•e•ren¶y sta-
tistick¶y znak X a naz¶yv¶a se tabulka rozd•elen¶‡ •cetnost¶‡ znaku X. Pro je•st•e lep•s¶‡
p•redstavu o nam•e•ren¶em znaku X se data z uveden¶e tabulky zn¶azor•nuj¶‡ graflcky.
4
Varianta Absolutn¶‡ Relativn¶‡ Absolutn¶‡ Relativn¶‡
•cetnost •cetnost kumulativn¶‡ kumulativn¶‡
•cetnost •cetnost
x[1] n1 p1 N1 P1
x[2] n2 p2 N2 P2
... ... ... ... ...
x[r] nr pr Nr Pr
Sou•cet n 1 { {
Tabulka 1.1: Tabulka rozd•elen¶‡ •cetnost¶‡ znaku X
Podle zp”usobu graflck¶eho zn¶azorn•en¶‡ tabulky rozd•elen¶‡ •cetnosti m”u•zeme mluvit o
sloupcov¶em diagramu absolutn¶‡ch (relativn¶‡ch) •cetnost¶‡, polygonu absolutn¶‡ (rela-
tivn¶‡ch) •cetnost¶‡, kruhov¶em diagramu absolutn¶‡ch (relativn¶‡ch) •cetnost¶‡. P•r¶‡slu•sn¶a
graflck¶a zn¶azorn•en¶‡ jsou na Obr.1.1. Podobn•e lze pro kardin¶aln¶‡ nebo ordin¶aln¶‡ z
Vloženo: 24.04.2009
Velikost: 193,80 kB
Komentáře
Tento materiál neobsahuje žádné komentáře.
Mohlo by tě zajímat:
Skupina předmětu MV011 - Statistika I
Reference vyučujících předmětu MV011 - Statistika I
Copyright 2024 unium.cz