Statistika i informatika 1.pdf
January 20, 2017 | Author: Boka | Category: N/A
Short Description
Download Statistika i informatika 1.pdf...
Description
Zoran Milošević Dragan Bogdanović
STATISTIKA I INFORMATIKA u oblasti medicinskih nauka
Niš, 2012.
Autori: Zoran Milošević, vanredni profesor Medicinskog fakulteta Univerziteta u Nišu Dragan Bogdanović, docent Državnog univerziteta u Novom Pazaru Izdavač: GALAKSIJA Za izdavača: Mlađan Ranđelović Recenzenti: Prof. dr Vera Grujić, Medicinski fakultet u Novom Sadu Prof. dr Eržebet Ač Nikolić, Medicinski fakultet u Novom Sadu Prof. dr Tatjana Ille, Medicinski fakultet u Beogradu Tehnički urednik: Dipl. ing. Stefan Bogdanović Štampa: GALAKSIJA - Lukovo Tiraž: 500 ISBN 978-86-6233-010-9 Zabranjeno preštampavanje i kopiranje bez saglasnosti autora i izdavača. Odlukom Nastavno-naučnog veća Medicinskog fakulteta Univerziteta u Nišu broj 14-7454-5/2-1 od 01.10.2012. godine odobreno je štampanje ove knjige u vidu udžbenika. CIP - Каталогизација у публикацији Народна библиотека Србије, Београд
PREDGOVOR Udžbenik je rezultat višegodišnjeg rada autora i njihovih saradnika sa Instituta za javno zdravlje i Medicinskog fakulteta Univerziteta u Nišu. Studenti će u njemu pronaći potreban materijal da se savladaju osnove medicinske statistike i informatike. Autori su uložili veliki napor kako bi u ovom udžbeniku studenti na jednom mestu mogli pronaći materijal za sticanje znanja i razumevanje statističke metodologije u oblasti biomedicinskih nauka. Uz svako poglavlje dati su i odgovarajući primeri za praktičnu primenu. Obradjena su sva značajna poglavlja deskriptivne i analitičke statistike. Udžbenik je napisan tako da studentima daje smernice za naučno istraživački rad i upućuje ih u osnove primene računarskih statističkih paketa u biomedicinskim naukama. Udžbenik je namenjen studentima osnovnih studija medicine, stomatologije, farmacije i strukovnih studija. Pored njih udžbenik mogu koristiti i studenti svih poslediplomskih studija i zdravstveni radnici i saradnici za obnavljanje stečenih znanja i njihovo unapredjivanje i rešavanje praktičnih naučno istraživačkih problema. Na savetima korisnim za pisanje ovog udžbenika autori duguju zahvalnost recenzentima: prof. dr Veri Grujić i prof. dr Eržebet Ač Nikolić sa Medicinskog fakulteta Univerziteta u Novom Sadu, kao i prof. dr Tatjani Ille sa Medicinskog fakulteta Univerziteta u Beogradu. Autori su zainteresovani za sve predloge i primedbe na rukopis koji je u udžbeniku sa željom da u sledećem izdanju on bude još kvalitetniji i sadržajniji. Niš, oktobar 2012. godine
Autori
Izvod iz recenzija Knjiga je napisana razumljivo, smisleno i u skladu je sa nastavnim planom i potrebama za razumevanje i prihvatanje biostatistike i informatike koji se realizuje na Medicinskom i srodnim fakultetima. Poglavlja su koncipirana tako da lagano uvode čitaoca u biostatistiku, njene mogućnosti i upućuju na korišćenje SPSS. Prof. dr Tatjana Ille Svako poglavlje je ilustrovano primerima, a na kraju svakog poglavlja su zadaci za vežbu. Posebna vrednost knjige je što sadrži uputstvo i način primene statističkog programa SPSS za sve prezentovane statističke analize. Koncepcija i redosled poglavlja su logični, knjiga je napisana stručno i razumljivim jezikom za korisnike čije bazično obrazovanje nije iz matematike i nauka baziranih na matematici. Prof. dr Eržebet Ač Nikolić Knjiga autora Zorana Miloševića i Dragana Bogdanovića predstavlja celinu u kojoj autori izlažu složenu problematiku precizno, stručno, kritički i analitički, vodeći organizaciju sadržaja postepeno i logično od opštih ka konkretnim pitanjima. Ova knjiga je namenjena studentima medicine, farmacije, stomatologije, ali ne samo njima. Ona može poslužiti i studentima drugih fakulteta i svima onima koji koriste statistiku u svom radu. Stoga, knjigu Statistika i informatika u oblasti medicinskih nauka preporučujem kao univerzitetski udžbenik i predlažem njeno štampanje, kako bi se omogućilo njeno korišćenje i u najširoj stručnoj javnosti. Prof. dr Vera Grujić
1. MEDICINSKA STATISTIKA 1.1. Definicija i predmet proučavanja Statistika nije nauka koja proučava zakone po kojima se odvijaju razne pojave u živoj prirodi i društvu, nego naučna metodologija kojom se ove pojave istražuju. Kako se ova metodologija zasniva na merenju, brojanju i računanju, odnosno na primenjenoj matematici, najprimerenija definicija bi bila: Statistika je naučni metod kvantitativnog proučavanja masovnih pojava u prirodi i društvu. Izraz statistika se u početku odnosio na prikupljanje i korišćenje podataka koji su bili od značaja za državu, kao što su evidencije o stanovništvu, posedima i prihodima, a vodi poreklo od italijanske reči state što znači država. Potreba za efikasnijom državnom administracijom, kao i osnivanje prvih osiguravajućih društava uticali su na razvoj vitalne statistike (praćenje i analiza rađanja i umiranja) u imperijalnoj Engleskoj XVII veka, a pioniri u ovoj oblasti bili su Džon Graunt (1620-1674. g.) i Vilijam Peti (1623-1687. g.). Gotovo u isto vreme Blejz Paskal (1623-1662. g.) i Pjer de Fermat (1601-1665. g.) postavili su osnove teorije verovatnoće, a u svrhu povećanja uspeha u igrama na sreću, koje su bile popularne u visokim društvenim krugovima u Francuskoj. Dalji podsticaj za razvoj statističke metodologije dala je astronomija, gde je rezultate mnogih pojedinačnih posmatranja bilo potrebno objediniti u jedinstvenu teoriju. Vodeće ličnosti u ovoj oblasti bili su Pjer Simon Laplas (1749-1827. g.) u Francuskoj i Karl Fridrih Gaus (1777-1855. g.) u Nemačkoj. Belgijski astronom i matematičar Adolfo Katlet (1796-1874. g.) je prvi počeo da primenjuje statističku metodologiju u biološkim, medicinskim i sociološkim istaživanjima, dok je englez Fransis Galton (1822-1911. g.) uveo analizu varijabilnosti i međuzavisnosti između vrednosti različitih obeležja (regresije i korelacije) u biološkim merenjima. Karl Pirson (1857-1936. g.) i Rafael Veldon (1860-1906. g.), profesori Univerzitetskog Koledža u Londonu, nastavili su dalji razvoj primene statističke metodologije u biologiji i uveli pojam biometrije za vrstu studija kojima su se bavili. Dominantna ličnost u razvoju statistike i biometrije u XX veku bio je Ronald Fišer (1890-1962. g.), statističar, biolog i genetičar iz Engleske. Široka primena računarske tehnologije od osamdesetih godina XX veka doprinela je da statistika postane jedna od naučnih oblasti sa najvećim stepenom razvoja. Predmet proučavanja statistike su masovne pojave u prirodi i društvu. One se sastoje iz mase pojedinačnih elemenata, koji kao nosioci prirode tih pojava u statističkom smislu predstavljaju statističke jedinice. Masovna pojava definisana pojmovno, prostorno i vremenski predstavlja osnovni skup ili populaciju.
5
Definisanje osnovnog skupa: • Pojmovno – određivanje elemenata skupa npr. starost stanovnika, sadržaj knjige, vrste telesnih povreda... • Prostorno – određivanje prostora npr. Niš, Nišavski okrug... • Vremensko – određivanje vremenskog trenutka ili razdoblja Statističke jedinice osnovnog skupa su sve istovrsne, ali ne i istovetne. Obeležja statitističkih jedinica koja ih čine neistovetnima predstavljaju predmet statističkih istraživanja. Nejednakost nekog obeležja između jedinica naziva se varijabilnost. Najčešće proučavani osnovni skup u medicinskim istraživanjima je stanovništvo ili populacija. Ljudi u ovom skupu predstavljaju statističke jedinice, a obeležja koja ih čine neistovetnim su brojna: pol, uzrast, obrazovanje, zanimanje, zdravstveno stanje, vakcinalni status i dr.
1.2. Razlike u proučavanju žive i nežive prirode NEŽIVA PRIRODA Jedna pojava se identifikuje kao uzrok, a druga kao posledica. Između pojava postoji striktna uzročno - posledična veza. Jedan isti uzrok daje uvek istu posledicu. Srazmerno dejstvu uzroka menja se i posledica. Mogu da se isključe svi sporedni faktori. Između pojava postoji matematička ili funkcionalna veza. Ispitivanjem jednog elementa donosi se zaključak o celoj masi jer su elementi međusobno istovetni i istorodni. Hipoteza se proverava klasičnim eksperimentom - ogledom.
ŽIVA PRIRODA Često nije moguće izvršiti identifikaciju uzroka i posledice. Između pojava ne postoji striktna uzročno - posledična veza. Nije 100% sigurno. Prodiranje virusa u organizam ne znači obavezno oboljevanje. Promena posledice nije srazmerna dejstvu uzroka. Na posledicu utiču i sporedni faktori koji se ne mogu isključiti. Između pojava postoji stohastička ili statistička veza. Pojave ispoljavaju svoje zakonitosti tek na masi elemenata, a elementi su međusobno istorodni ali nisu istovetni. Hipoteza se proverava posebnim statističkim testovima.
1.3. Teorija verovatnoće i zakon velikih brojeva Statistika je kao naučno istraživački metod zasnovan na teoriji verovatnoće i njenom postulatu – zakonu velikih brojeva. TEORIJA VEROVATNOĆE se bavi utvrdjivanjem mogućnosti za nastajanje događaja ili dobijanja nekih vrednosti.
6
Verovatnoća javljanja nekog događaja jednaka je:
P
n N
Gde je: n – broj očekivanih (željenih) događaja, a N – ukupan broj mogućih događaja. Verovatnoća se kreće u intervalu od 0 do 1 (0 do 100%). 0 - potpuno odsustvo verovatnoće 1 - puna verovatnoća Potpuno odsustvo verovatnoće (0) ne može nastati ako postoji bar jedna očekivana eventualnost, kao što i puna, totalna verovatnoća (1) nije moguća čim postoje više mogućih događaja od jednog. Kod statističke (stohastičke) veze verovatnoća je uvek manja od 1. Kod matematičke veze verovatnoća može da bude i 1. P=1 P>0,5 P=0,5 P 0 je leptokurtična i u poređenju sa normalnom distribucijom, njen vrh je viši i oštriji. Kao i kod skjunisa, vrednost kurtozisa između -1 i +1 ne ukazuje na veće odstupanje od normalne distribucije, ali se smatra da su vrednosti od -2 do +2 prihvatljive.
6.5. t - distribucija Ovu vrstu rasporeda je formulisao Vilijam S Goset, poznat pod pseudonimom „Student“ pa se zove i Studentova t-distribucija. Njene karakteristike su: - Ima sličan oblik kao normalna distribucija samo što je šira i niža. t-raspored je isto simetričan u odnosu na svoju aritmetičku sredinu t=0 i zvonastog je oblika, ali se u intervalu t=0±1,96SD nalazi manje od 95% t-vrednosti, odnosno ovaj procenat tvrednosti se nalazi u širem intervalu; - Širina intervala zavisi od broja ispitanika, odnosno veličine uzorka; - Kako raste broj ispitanika t-distribucija je sve sličnija normalnoj raspodeli; - Primjenjuje se u računanju intervala pouzdanosti i testiranju hipoteza o razlici aritmetičkih sredina između dva uzorka. Razlika između Z i t-rasporeda najbolje može da se uoči iz grafikona: Standardizovana Z distribucija
Studentova t-distribucija N=4 (ss=N-1=3)
Z=-1,96 t=-3,18
95% 95%
Z=+1,96 t=+3,18
Za krivu t-distribucije ne važi sigma tri pravilo jer širina intervala u kome se nalazi 95% t-vrednosti zavisi od broja ispitanika, odnosno veličine uzorka. Što je uzorak manji to je širina intervala veća. Tako za se uzorak N=4, 95% t-vrednosti nalazi u intervalu: t =-3,18 do +3,18.
69
Na osnovu iznetih osobina Studentovog t-rasporeda izrađena je tabela za granične t-vrednosti za odgovarajuću verovatnoću i stepen slobode. Stepen Stepen Verovatnoća Verovatnoća slobode 0,95 0,99 0,999 slobode 0,95 0,99 0,999 1 12,706 63,657 636,619 22 2,074 2,819 3,792 2 4,303 9,925 31,599 23 2,069 2,807 3,768 3 3,182 5,841 12,924 24 2,064 2,797 3,745 4 2,776 4,604 8,610 25 2,060 2,787 3,725 5 2,571 4,032 6,869 26 2,056 2,779 3,707 6 2,447 3,707 5,959 27 2,052 2,771 3,690 7 2,365 3,499 5,408 28 2,048 2,763 3,674 8 2,306 3,355 5,041 29 2,045 2,756 3,659 9 2,262 3,250 4,781 30 2,042 2,750 3,646 10 2,228 3,169 4,587 40 2,021 2,704 3,551 11 2,201 3,106 4,437 50 2,009 2,678 3,496 12 2,179 3,055 4,318 60 2,000 2,660 3,460 13 2,160 3,012 4,221 70 1,994 2,648 3,435 14 2,145 2,977 4,140 80 1,990 2,639 3,416 15 2,131 2,947 4,073 90 1,987 2,632 3,402 16 2,120 2,921 4,015 100 1,984 2,626 3,391 17 2,110 2,898 3,965 150 1,976 2,609 3,357 18 2,101 2,878 3,922 200 1,972 2,601 3,340 19 2,093 2,861 3,883 300 1,968 2,592 3,323 20 2,086 2,845 3,850 500 1,965 2,586 3,310 21 2,080 2,831 3,819 1,960 2,576 3,291 Na primer, granična vrednost t za verovatnoću od 95% i stepen slobode 6 iznosi: t(0,95;6)=2,447.
6.6. Hi kvadrat (χ2) distribucija Hi kvadrat distribucija je raspodela zbira kvadrata Z vrednosti. Stepen slobode u ovoj distribuciji jednak je broju Z vrednosti čije kvadrate vrednosti sabiramo. Prema tome, Hi kvadrat distribucija sa stepenom slobode 1 je raspodela kvadrata svih pojedinačnih Z vrednosti iz standardizovane normalne distribucije. U ovoj distribuciji bi površina ispod krive za 2 =4 bila jednaka površini ispod standardizovane normalne krive za Z=2 jer je 4=22. Karakteristike 2 distribucije: - Kriva nije simetrična i zakrivljena je u desno; - Distribucija uvek ima pozitivne vrednosti; - Zavisi od broja stepeni slobode: kako raste broj stepeni slobode distribucija postaje sve više simetrična i sličnija normalnoj distribuciji; - Aritmetička sredina Hi kvadrat distribucije jednaka je stepenu slobode.
70
Na sledećem grafikonu su prikazane krive Hi kvadrat distribucija za stepene slobode 2, 4 i 6.
ss=4
ss=2
ss=6
Razmotrimo sledeći problem: Kolika je verovatnoća da će zbir kvadrata bilo koje slučajno odabrane dve Z vrednosti iz standardizovane normalne distribucije biti jednak 6 ili veći? Kako se radi o zbiru dve Z vrednosti, odgovor ćemo tražiti u Hi kvadrat distribuciji sa stepenom slobode 2. U tabeli graničnih Hi kvadrat vrednosti za određeni broj stepeni slobode i određenu verovatnoću uočavamo da za stepen slobode 2 i verovatnoću od 0,95 (95%) granična tablična Hi kvadrat vrednost iznosi 5,991 što je gotovo jednako 6. Prema tome, verovatnoća da će zbir kvadrata bilo koje slučajno odabrane dve Z vrednosti iz standardizovane normalne distribucije biti jednak 6 ili veći iznosi 100-95=5%. Deo tabele graničnih Hi kvadrat vrednosti Stepen slobode 1 2 3 4 5 6 7 8 9 10
Stepen Stepen Verovatnoća Verovatnoća Verovatnoća 0,95 0,99 slobode 0,95 0,99 slobode 0,95 0,99 3,841 6,635 11 19,675 24,725 21 32,671 38,932 5,991 9,210 12 21,026 26,217 22 33,924 40,289 7,815 11,345 13 22,362 27,688 23 35,172 41,638 9,488 13,277 14 23,685 29,141 24 36,415 42,980 11,071 15,086 15 24,996 30,578 25 37,652 44,314 12,592 16,812 16 26,296 32,000 26 38,885 45,642 14,067 18,475 17 27,587 33,409 27 40,113 46,963 15,507 20,090 18 28,869 34,805 28 41,337 48,278 16,919 21,666 19 30,144 36,191 29 42,557 49,588 18,307 23,209 20 31,410 37,566 30 43,773 50,892
71
Mnogi statistički testovi zasnivaju se na Hi kvadrat distribuciji, a najpoznatiji od njih je Hi kvadrat test kojim se porede učestalosti pojedinih modaliteta kategorijskih (atributivnih) obeležja.
6.7. F distribucija F distribucija se može definisati kao odnos između varijansi dve Hi kvadrat distribucije: 2 /n F( n , m ) 2n m / m Njene karakteristike su: - Zakrivljena je prema desno; - Zavisi od broja stepeni slobode obe Hi kvadrat vrednosti; - Upotrebljava se za poređenje dve varijanse, kao i za poređenje više od dve aritmetičke sredine analizom varijanse (ANOVA). Kriva F distribucije kada stepeni slobode obe Hi kvadrat vrednosti iznose po 10 predstavljena je na sledećem grafikonu:
I za ovu vrstu distribucije je kontruisana tabela sa graničnim F vrednostima za određene verovatnoće i za određen broj stepeni slobode. Deo tabele za granične F vrednosti za nivo verovatnoće od 95% ss2/ss1 1 2 3 4 5 6 7 8 9 10 12
72
1 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,75
2 199,5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,89
3 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,49
4 224,6 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,26
5 230,2 19,3 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,11
6 234,0 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,00
7 236,8 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 2,91
8 238,9 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,85
9 240,5 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,80
10 241,9 19,4 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,75
12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,69
7. TESTIRANJE HIPOTEZA I PROCENA PARAMETARA POPULACIJE NA OSNOVU UZORKA Hipoteza predstavlja pretpostavku koja motiviše istraživanje, a testiranje hipoteze je statistički postupak kojim se kvantitativno određuje da li i koliko pouzdano raspoloživi podaci potvrđuju tu pretpostavku. U istraživanjima se formulišu dve međusobne isključive, suprotne pretpostavke o ishodu ispitivanja, a to su nulta hipoteza (Ho) i alternativna ili radna hipoteza (Ha). Najelementarnije iskazana nulta hipoteza glasi - Između aritmetikih sredina ili između proporcija nekog obeležja u dva osnovna skupa ne postoji značajna razlika. Ako razlika i postoji ona je slučajnog karaktera, a uzorci na kojima je vršeno ispitivanje se ponašaju kao da pripadaju istom osnovnom skupu. Matematički se definiše kao:
Ho : x1 x 2
ili
x1 x 2 0
Nultoj hipotezi se pridružuje alternativna ili radna hipoteza, koja tvrdi suprotno: Izmedu aritmetikih sredina ili između proporcija nekog obeležja u dva osnovna skupa postoji značajna razlika i ona nije slučajnog karaktera, već je nastala pod dejstvom sistemskih ili eksperimentalnih faktora. Matematički se definiše kao:
Ho : x1 x 2
ili
x1 x 2 0
Naravno, i jedna i druga hipoteza mogu da imaju i širi smisao, zavisno od konkretnog problema koji se rešava. Prema Ronaldu Fišeru nulta hipoteza je svaka pretpostavka koju želimo da proverimo u smislu "nulifikacije", odnosno poništenja. Statističkom metodologijom se proverava tvrdnja nulte hipoteze i uvek se polazi od pretpostavke da je ona tačna odnosno istinita i da "neka razlika" nije statistički značajna. Istinitost nulte hipoteze se utvrđuje specifičnim statističkim testovima. Ako se odgovarajućim statističkim testom, za odgovarajuću verovatnoću i prag značajnosti, utvrdi da razlika nije statistički značajna prihvata se nulta hipoteza kao tačna i istinita, a odbacuje radna hipoteza, kao neistinita i netačna. Suprotno, ako statistički test pokaže da je razlika statistički značajna, nulta hipoteza se odbacuje kao netačna i neistinita, a prihvata se radna hipoteza kao istinita i tačna. Prema tome, odgovarajućim specifičnim testom, testiramo isključivo nultu hipotezu, a alternativnu prihvatamo ili odbacujemo posredno. Bilo koji tip testiranja statističkih hipoteza može da se izvede u pet etapa: 1. Formulisanje nulte i alternativne hipoteze; 2. Odreduje se prag (nivo) značajnosti. Najčešće su to p=0,05 ili p=0,01; 3. Odreduje se adekvatan test i 4. Obradi se jedan ili više uzoraka, čije podatke koristimo za izračunavanje i 5. Na osnovu rezultata testa donosimo odluku o prihvatanju ili odbacivanju nulte hipoteze (Ho). Parametrijski testovi Parametrijske testove primenjujemo kada su vrednosti ispitivanog obeležja date numerički, odnosno kada su izmerene intervalnom ili skalom odnosa i kada iz njih možemo da izračunamo: aritmetičku sredinu, varijansu, standardnu devijaciju i standardnu grešku. Parametrijski testovi polaze od pretpostavke da je raspored unutar
73
skupa, iz koga je dobijen uzorak, normalan ili pak uzorak mora da bude veći od 30 jedinica. Od parametrijskih testova najpoznatiji je Studentov t-test. Neparametrijski testovi Pri istraživanjima i eksperimentima mogu da se dobiju podaci koji znatno odstupaju od normalnog rasporeda, ili su dati opisno pa se iz njih ne mogu da izračunaju aritmetička sredina i standardna devijacija. U ovim slučajevima, a pogotovu ako su vrednosti obeležja date opisno te raspolažemo samo frekvencijama pojedinih modaliteta obeležja, za testiranje nulte hipoteze primenjuju se tzv. neparametrijski testovi ili testovi nezavisni od rasporeda. Oni traže manje uslova i manje informacija za primenu (prednost), ali je njihova snaga (power) manja, pa su manje precizni i pouzdani.
7.1. Uzorak Osnovni skup ili populacija se sastoji od svih elemenata ili jedinica posmatranja čije karakteristike ispitujemo – pojedinaca (bića), stvari ili predmeta. Osnovni skup koji se proučava naziva se još i ciljnom populacijom. Svi elementi osnovnog skupa su istorodni, ali ne i istovetni. Kako se sastoji od svih jedinica koje su nosioci određene karakteristike (osobine, obeležja), osnovni skup sadrži sve vrednosti koje ta slučajno promenljiva može imati, a koje se mogu evidentirati merenjem ili brojanjem. Idealno bi bilo kada bi bili u mogućnosti da obeležja koja proučavamo evidentiramo za svaku jedinicu populacije i na osnovu takve evidencije izvršimo ocenu i donesemo zaključke, međutim u praksi to gotovo nikada nije moguće. Zbog toga je u statistici razrađena i racionalno određena sledeća metodologija: Donošenje sudova i zaključaka o celini pojave vrši se na osnovu proučavanja i poznavanja određenog broja statističkih jedinica, odnosno na osnovu dela osnovnog skupa - uzorka. Jedinica posmatranja ili element uzorka ili osnovnog skupa jeste određeni subjekat ili objekat (na primer: osoba, firma, predmet, država) o kojem se prikupljaju podaci, odnosno, na kojem se određena pojava statistički posmatra. Adekvatan uzorak mora da ispuni principe nepristrasnosti, reprezentativnosti i ekonomičnosti. Nepristrasnost uzorka se postiže načinom i metodama odabiranja uzorka koji su razrađeni u statističkoj praksi, a koji baziraju na teoriji verovatnoće i postavkama slučajnog kombinovanja elemenata. Reprezentativnost podrazumeva da uzorak treba da obuhvati one statističke jedinice koje će u sebi nositi sve karakteristike osnovnog skupa, odnosno one jedinice čija obeležja kada se izbroje ili izmere i iz njihovih vrednosti izračunaju odgovarajući parametri (aritmetička sredina, standardna devijacija, učestalost javljanja neke pojave i td.), oni budu isti ili približno isti kao i pravi parametri osnovnog skupa. Kvalitet, tačnost i preciznost rezultata istraživanja, tj. tačnost procene osnovnog skupa na osnovu uzorka, su direktno proporcionalni reprezentativnosti uzorka. Reprezentativnost uzorka zavisi od varijabilnosti vrednosti posmatranog obeležja unutar skupa i od veličine uzorka. Što je uzorak veći to je i njegova reprezentativnost veća, kao i preciznost i sigurnost ocene parametara osnovnog skupa.
74
Što je varijabilnost vrednosti obeležja veća, to je skup manje homogen, pa je za odgovarajuću preciznost i pouzdanost procene potreban veći uzorak. Ekonomičnost je princip koji nameću finansijska i vremenska ograničenja. Veliki uzorak zahteva više finansijskih i ljudskih resursa, kao i vremena za ispitivanje. Princip ekonomičnosti je suštinski suprotan principu reprezentativnosti.
7.1.1. Jednostavan slučajan uzorak Kada svaka jedinica iz populacije ima jednaku šansu da bude izabrana, uzorak je slučajan, randomiziran (engl. random sample). Ranije su najčešće korišćene metode za izbor slučajnog uzorka bile lutrijska metoda i izbor pomoću tablice slučajnih brojeva. Danas se za izbor slučajnog uzorka pretežno koriste računarski generatori slučajnih brojeva. Da bi se mogao izvršiti izbor statističkih jedinica, potrebno je odrediti okvir izbora, odnosno definisati populaciju iz koje se bira. Na primer, ukoliko želimo da utvrdimo kakav je stav studenata o zakonu o zaštiti od duvanskog dima, svi studenti univerziteta predstavljaju okvir izbora. Zatim je potrebno svakoj statističkoj jedinici dodeliti identifikacioni broj, u našem primeru to može biti broj indeksa, a potom se ovi brojevi koriste da bi se nekom od metoda slučajnog izbora izvršilo izdvajanje uzorka.
7.1.2. Sistematski uzorak Kada se izbor statističkih jedinica u uzorak vrši po nekom sistemu, formira se sistematski uzorak. Na primer, želimo da utvrdimo neki stav u populaciji telefonskom anketom, birajući svaki deseti broj telefona iz telefonskog imenika, pri čemu samo prvi broj izaberemo metodom slučajnog izbora. U nekim slučajevima taj način izbora nosi rizik da bude pristrasan. U primeru sa telefonskim imenikom, ukoliko anketiranje vršimo u prepodnevnim satima ispitivanjem će verovatno biti u manjem procentu obuhvaćeno radno aktivno stanovništvo. Sistematski izbor je jednostavniji od metode slučajnog uzorka, pa se u praksi često primenjuje, ali pri tome valja biti oprezan pri donošenju zaključaka o populaciji na osnovu uzorka.
7.1.3. Višestepeni uzorak Postoje slučajevi kada nije moguće primeniti izbor slučajnog uzorka zbog veličine i raširenosti populacije. Na primer, želimo da utvrdimo zastupljenost povišenog krvnog pritiska kod odraslog stanovništva cele države, koje broji 7 miliona ljudi, na uzorku od 10000 ispitanika. Mogli bi korišćenjem računara iz popisnih podataka metodom slučajnog izbora izdvojiti potrebne ispitanike. Međutim, bilo bi skupo i komplikovano poslati ispitivača da u nekom selu pregleda jednog jedinog ispitanika koji je izabran u uzorak. Zbog toga je svrsishodno prvo iz liste naselja slučajnim izborom izdvojiti određeni broj naselja u kojima će se sprovesti ispitivanje. Zatim se iz tih naselja prema popisnim podacima izabere slučajnim izborom srazmeran broj stanovnika.
75
Višestepeni uzorak daje dobre podatke za populaciju u celini, ali ne i za pojedina naselja jer broj ispitanika u njima ipak nije dovoljan za zaključivanje.
7.1.4. Stratifikovani uzorak Kada je potrebno analizirati neku pojavu u celokupnoj populaciji, ali i posebno po populacionim grupama od posebnog interesa - stratumima, formira se stratifikovani uzorak. Svaki stratum je podpopulacija koja bi trebalo da je homogena, a između pojedinih stratuma se očekuju značajne razlike. Za svaki stratum se određuje poseban slučajni uzorak. Veličina uzoraka iz stratuma je obično proporcionalna udelima stratuma u celokupnoj populaciji, ali to nije pravilo. Kada je neka pojava retko zastupljena, iz stratuma koji imaju mali broj statističkih jedinica mogu se izabrati veći uzorci nego što je njihova proporcija u populaciji. Prema tome, stratifikovani uzorci se mogu podeliti na proporcionalne i neproporcionalne. Na primer, želimo da utvrdimo prosečan dnevni kalorijski unos hranom u jednoj opštini sa 40000 stanovnika, anketirajući uzorak od 1000 ispitanika. Očekujemo da će kalorijski unos biti značajno veći kod gradskog stanovništva. Ako u gradu živi 30000 (75%), a u selima 10000 (25%) stanovnika, tada će i uzorak sadržati istu proporciju, odnosno 750 ispitanika iz grada i 250 sa sela. U drugom primeru želimo da ispitamo psihičke efekte estetske hirurgije kod operisanih osoba, a posebno smo zainteresovani za moguće razlike između muškaraca i žena. Uvidom u dokumentaciju klinike za plastičnu hirurgiju došli smo do podatka da je na lični zahtev do sada operisano 1900 (95%) žena i 100 (5%) muškaraca. Kada bi primenili formulu za adekvatnu veličinu uzorka na celokupnu populaciju od 2000 operisanih osoba, utvrdili bi da je potrebno ispitati 330 slučajno izabranih pacijenata. U proporcionalnom stratifikovanom uzorku to bi iznosilo 313 (94,85%) žena i 17 (5,15%) muškaraca. Međutim, primena ovakvog uzorka ne bi omogućila objektivno poređenje između žena i muškaraca zbog malog broja muškaraca. Zbog toga je potrebno primeniti formulu za adekvatnu veličinu uzorka posebno za žene, a posebno za muškarce. Primenom ove metode bi broj žena u uzorku iznosio 330 (80,5%), a muškaraca 80 (19,5%). Dobili smo neproporcionalni stratifikovani uzorak koji omogućava objektivno poređenje između žena i muškaraca. Primećujemo da je ukupan neproporcionalni uzorak veći za 80 ispitanika nego što bi bio proporcionalni.
7.1.5. Višefazni uzorak Upotrebljava se kada je komplikovano ili skupo sve elemente istraživanja sprovesti na svim ispitanicima iz uzorka. Tada deo istraživanja sprovodimo samo na poduzorku. Na primer, želimo da ispitamo učestalost gojaznosti kod stanovništva cele države na višestepenom uzorku od 20000 ispitanika. Između ostalog, želimo da utvrdimo i učestalost povišenog nivoa masti u serumu kod osoba starijih od 30 godina, a njih u uzorku ima 12000. Uzimanje krvi od 12000 osoba bi bila komplikovana i skupa procedura. Zbog toga odlučujemo da laboratorijska ispitivanja nivoa masti u serumu sprovedemo kod svakog desetog (10%) od njih, odnosno 1200 ispitanika starijih od 30 godina.
76
7.1.6. Klaster uzorak Sličan je višestepenom uzorku. Populacija se podeli na klastere, a zatim se za uzorak prvo slučajno izabere određen broj klastera, a zatim se iz tih klastera slučajno bira određen broj jedinica posmatranja. Klasteri predstavljaju grupe ili celine koje prirodno i fizički objedinjuju jedinice posmatranja. Primeri klastera su škole ili preduzeća. Da bi se smanjilo prostorno raspršenje jedinica posmatranja formiraju se zonski uzorci. Zone su klasteri koji su definisani geografski - opštine, naselja, mesne zajednice. Kao što smo na primeru ispitivanja učestalosti gojaznosti mogli da vidimo, pojedine vrste odabira uzoraka se mogu međusobno kombinovati. Ovo važi za sve vrste izbora, osim za jednostavni slučajni uzorak.
7.2. Distribucija aritmetičkih sredina jednakih uzoraka Zaključci koji se donose na osnovu podataka u pravilu polaze od uzorka ispitanika. Na uzorku se izvode merenja, s rezultatima tih merenja se računa, dobijaju se informacije o parametrima uzorka, a zatim se vrši generalizacija na populaciju iz koje uzorak potiče. Ako imamo jednu populaciju (osnovni skup) od N jedinica (članova): x1, x2, . . ., xN Iz te populacije odaberimo k slučajnih uzoraka od kojih svaki ima n članova: x11, x12, . . ., x1n 1. uzorak x21, x22, . . ., x2n 2. uzorak x31, x32, . . ., x3n 3. uzorak … xk1, xk2, . . ., xkn k. uzorak Aritmetičke sredine tih uzoraka su: x1 , x 2 ,.... x k i one nisu međusobno jednake, odnosno pokazuju varijabilnost. Iz ovih aritmetičkih sredina možemo da izračunamo jednu zajedničku aritmetičku sredinu svih uzoraka ( x ), kao i njihovu standardnu devijaciju ( SDuzoraka ). Zajednička aritmetička sredina svih uzoraka ( x ) istovremeno predstavlja i aritmetičku sredinu populacije, odnosno osnovnog skupa ( x os ) – prvo pravilo. Navedena tvrdnja vredi samo ako načinimo sve moguće uzorke sa n članova iz jedne populacije. Distribucija aritmetičkih sredina uzoraka iz jedne populacije će biti normalna ako je distribucija vrednosti posmatranog obiležja u populaciji normalna. Međutim, po centralnoj graničnoj teoremi distribucija aritmetičkih sredina uzoraka iz jedne populacije će biti normalna i ako distribucija vrednosti obiležja u populaciji nije normalna ukoliko su uzorci dovoljno veliki i ako je varijansa populacije, odnosno osnovnog skupa ( SDos2 ) konačan broj. Obično su za ovaj uslov zadovoljavaći uzorci veći od 30 jedinica (n>30).
77
Aritmetičke sredine jednakih malih uzoraka (n1,96 sa 95% verovatnoće možemo tvrditi da u populaciji postoji pozitivna asimetričnost. Napomena: standardizovani skjunis nam ukazuje na verovatnoću postojanja asimetričnosti u populaciji, ali ne i na veličinu te asimetričnosti.
80
Identičan princip koristi se i za procenu visine distribucije u populaciji. Standardizovani kurtozis se izračunava kao količnik između kurtozisa dobijenog iz uzorka i standardne greške kurtozisa, a njegova vrednost se tumači na sledeći način: kada je standardizovani kurtozis < −1,96 sa 95% verovatnoće možemo tvrditi da je distribucija vrednosti obeležja u populaciji platikurtična, a kada je standardizovani kurtozis >1,96 sa 95% verovatnoće možemo tvrditi da je distribucija vrednosti obeležja u populaciji leptokurtična, ali ne i u kolikoj meri. Zadaci za vežbanje
1. Ispitivana je telesna visina dečaka i devojčica u prvom razredu osnovne škole. Dečaci: n=150, x =154cm, SD=11,3 Devojčice: n=160, x =142cm, SD=9,7 Konstruisati interval poveranja za jednu i drugu populaciju za p=0,95, p=0,99. 2. Prosečno vreme oporavka nakon povrede ligamenata na Klinici za rehabilitaciju u Nišu je x =33 dana i SD=4,5 dana. Sa verovatnoćom od 95% i 99% odrediti koliko je prosečno lečenje svih pacijenata u Nišavskom okrugu? 3. U junskom ispitnom roku ispit iz statistike položilo je 150 studenata medicine i 50 studenata stomatologije. Prosečna ocena studenata medicine bila je x =8,5 i SD=1,5, a studenata stomatologije x =7,5 i SD=1,5. Proceniti kolika je bila prosečna ocena svih studenta medicine i stomatologije u školskoj 2009/2010. godini? 4. Koliko se uzoraka veličine n=2, mogu dobiti uz vraćanje iz osnovnog skupa N=6 jedinica, a koliko uzoraka iste veličine bez vraćanja? 5. Iz osnovnog skupa od N=6 osoba kojima je izmeren sistolni arterijski pritisak, odaberi sve moguće uzorke veličine n=2 i konstruiši distribuciju njihove frekvencije, oko aritmetičke sredine osnovnog skupa. Osobe 1 2 3 4 5 6
Krvni pritisak 160 140 130 165 150 155
Na osnovu datih podataka dokaži: - prvo pravilo: xuzoraka x os - drugo pravilo: SDos2 n SDuz2 - da je SDos>SDuz
81
- Koliki se procenat uzoraka nalazi u intervalu: x os 1, 65SG - Koliko je uzorak koji ima aritmetičku sredinu od 125mmHg udaljen od aritmetičke sredine osnovnog skupa. 6. Na osnovu podataka o apsentizmu (odsutnost sa posla zbog bolesti i povreda) u jednom preduzeću izvučen je uzorak od 150 radnika. Na osnovu uzorka izračunato je prosečno godišnje odsustvovanje sa posla po jednom radniku od 29 dana sa standardnom devijacijom od 6 dana. Oceniti sa verovatnoćom od P=0,9 prosečno vreme odsustvovanja za sve radnike. 7. Istraživač je želeo da ispita potrošnju lekova u jednom okrugu u odnosu na kategoriju osiguranja: radničko, zemljoradničko i neosigurana lica i to na uzorku od 1.400 lica. Navedeni okrug je imao 750000 stanovnika od kojih: - radničko osiguranje 300.000 - zemljoradničko osiguranje 250.000 - neosigurana lica 200.000 Odredi proporcionalno učešće broja jedinica iz svakog stratuma u uzorku od 1.400 lica. 8. Ispitivana je visina holesterola u krvi kod seoske i gradske populacije i to na osnovu uzoraka: a) gradsko stanovništvo: n=800; x =4,3 i SD=0,9 b) seosko stanovništvo: n=540; x =5,2 i SD=1,0 Konstruiši intervale pouzdanosti za jednu i drugu populaciju za P=0,999. 9. Kod 30 dijabetičara na klinici za endokrinologiju u Nišu određivan je nivo glikemije, dobijene su sledeće vrednosti: H 6,2 – 7,49 7,5 – 8,79 8,8 – 10,09 10,1 – 11,39 11,4 – 12,69 12,7 – 13,99 Σ
f 6 7 4 4 6 3 30
Sa verovatnoćom od 95% odredi kolika je prosečna glikemija kod svih dijabetičara u Nišu. 10. U niškom Kliničkom centru prosečno lečenje bolesnika je 50 dana ( x =50) i SD=5. Izračunati: Koji procenat bolesnika je lečen manje od 25 dana? Koji procenat bolesnika je lečen od 45 do 55 dana? Koji procenat bolesnika je lečen više od 70 dana? Koji procenat bolesnika je lečen od 20 do 30 dana? Proceniti kolika je prosečna dužina lečenja u svim kliničkim centrima u Srbiji sa verovatnoćom od 95%?
82
7.6. Polazne osnove za izračunavanje veličine uzorka Određivanje adekvatne veličine uzorka5 je jedan od najznačajnijih zadataka pri dizajnu ispitivanja koji može bitno da utiče na donošenje preciznih zaključaka o postojanju ili nepostojanju značajnih razlika između vrednosti numeričkih karakteristika ispitanika, učestalosti atributivnih obeležja, kao i postojanju ili nepostojanju značajnih uticaja ili interakcija između ispitivanih faktora. Procedure kojima se određuje odgovarajuća veličina uzorka baziraju na korišćenju formula ili specijalno dizajniranih tabela i dijagrama.
7.6.1. Određivanje najvažnijih obeležja ispitivanja U svakom istraživanju definišu se pretpostavljeni uzroci (nezavisno promenljive varijable) i njihove posledice (zavisno promenljive - posledične varijable), kao i jedan broj nezavisnih varijabli koje se eventualno mešaju u odnose između uzroka i posledica. Kako bi se pristupilo određivanju odgovarajuće veličine uzorka neophodno je predhodno definisati jedno ili nekoliko najvažnih obeležja koje se ispituju. To mogu biti numeričke (težina, visina, broj eritrocita...), ali i atributivne (kategorijske) promenljive (pol, školska sprema, zanimanje...). Ukoliko je moguće izdvojiti jedno najvažnije obeležje, tada ono predstavlja osnovu za izračunavanje odgovarajuće veličine uzorka i samo ono će biti uključeno u formulu. U slučajevima kada je nekoliko varijabli podjednako ili približno značajno u istraživanju, svaka od njih se uključuje u odgovarajuću posebnu formulu, a po pravilu se za adekvatnu veličinu uzorka bira najveća izračunata vrednost. Izuzetak je situacija u kojoj je prema jednoj od značajnih promenljivih potrebna veličina uzorka izrazito veća nego prema svim drugim značajnim varijablama. Tada je moguće za odgovarajuću veličinu uzorka uzeti drugu po veličini izračunatu vrednost. Kada je najvažnije obeležje ispitivanja neka kategorijska promenljiva, a pogotovo kada je to dihotomno obeležje (muški-ženski pol, oboleo-zdrav i slično), potrebna veličina uzorka je po pravilu veća nego kada je to neka numerička promenljiva.
7.6.2. Kontrola greške procene Sve formule koje se koriste za izračunavanje adekvatne veličine uzorka uključuju jedan, dva ili više kriterijuma za kontrolu greške procene rezultata dobijenih ispitivanjem uzorka, a ne populacije u celini. Statistički parametri čije je vrednosti u tu svrhu potrebno uneti u formule su različiti, a najčešće su to: verovatnoća greške tipa I, verovatnoća greške tipa II, nivo pouzdanosti, snaga studije, margine greške i granična tablična z ili t vrednost.
5
Izrazi "adekvatna veličina uzorka" i "potrebna veličina uzorka" predstavljaju najmanji broj jedinica posmatranja koja je potrebno obuhvatiti u ispitivanju, a podrazumeva se da je veći broj jedinica posmatranja ne samo dozvoljen već i preporučen ("Što više to bolje").
83
Verovatnoća greške tipa I Greška tipa I (α greška) nastaje u situaciji kada istraživač vršeći procenu na osnovu uzorka pogrešno zaključuje da postoji značajna razlika između dve grupe, dok te razlike u celoj populaciji zaista nema. Drugim rečima, nultu hipotezu bi trebalo prihvatiti, ali je zbog zaključivanja na osnovu uzorka ona odbačena. Nivo greške tipa I predstavlja verovatnoću da će biti odbačena istinita nulta hipoteza. Verovatnoća greške tipa I se naziva kriterijum statističke značajnosti i obeležava se sa p, a u istraživanjima se najčešće koriste verovatnoće greške tipa I manje od 0,05 (5%), 0,01 (1%) i 0,001 (0,1%). Nivo verovatnoće greške manji od 5% je prihvatljiv u većini istraživanja. Niži nivoi verovatnoće greške se koriste u slučajevima kada su odluke bazirane na rezultatima ispitivanja kritične, odnosno mogu da uzrokuju oštećenja zdravlja ili veće finansijske gubitke. Pri korišćenju svih statističkih testova, pored vrednosti testa izračunava se i p vrednost. Kada je ona manja od 0,05 istraživač može da zaključi da razlika koja postoji između dve grupe ispitanika u uzorku reprezentuje pravu razliku koja postoji i u populaciji, pri čemu je ispunjen kriterijum statističke značajnosti pri odbacivanju nulte hipoteze. Nivo pouzdanosti Kada je verovatnoća greške procene da razlika koja postoji između dve grupe iz uzorka odražava pravu razliku u populaciji iz koje je uzorak izabran manja od 0,05 (5%), tada je verovatnoća istinitosti procene veća od 0,95 (95%). Ovo je ujedno verovatnoća sa kojom će pri ispitivanju na uzorku biti odbačena neistinita nulta hipoteza, odnosno biti prihvaćena istinita radna hipoteza i ona se naziva nivo pouzdanosti. Zbir nivoa pouzdanosti i dozvoljenog nivoa greške tipa I iznosi 1 (100%). Prema tome, ukoliko smo se u dizajnu studije opredelili za dozvoljeni nivo greške tipa I manji od 5%, tada nam je nivo pouzdanosti veći od 95%. Margina greške procene Margina greške predstavlja polovinu širine intervala poverenja za izračunatu vrednost nekog statističkog parametra kojim vršimo procenu osnovnog skupa na osnovu uzorka. Kohran prihvatljivu marginu greške procene definiše kao rizik koji je istraživač spreman da prihvati pri proceni parametara osnovnog skupa na osnovu uzorka. U rezultatima istraživanja često se prikazuje samo jedan broj, kao što je razlika između srednjih vrednosti nekog obeležja ili razlika između dve proporcije. Statističkim testovima zatim se procenjuje značajnost ove razlike i prihvata ili odbacuje nulta hipoteza za određeni nivo verovatnoće procene. Ovakav način zaključivanja se naziva pojedinačna procena (procena u jednoj tački). Međutim, ako se pored testiranja značajnosti razlike dve vrednosti prikaže i interval poverenja (sa određenim nivoom verovatnoće, najčešće 95%) koji okružuje ovu razliku, dobija se uvid u rang mogućih vrednosti za pravu razliku, koja bi se dobila kada bi ispitivanje obuhvatilo ceo osnovni skup. Ovakav način zaključivanja se naziva intervalna procena. Osim za razlike između srednjih vrednosti i proporcija, intervali poverenja se mogu izračunati i za pojedinačne srednje vrednosti, pojedinačne proporcije, koeficijente regresije, vrednosti relativnog rizika i druge statističke parametre. Kada se u formulama za izračunavanje veličine uzorka zahteva unos margine greške procene postoji opšte pravilo da je, umesto izračunavanja intervala poverenja,
84
prihvatljivo koristiti margine greške od 5% za kategorijske podatke i od 3% za numeričke podatke. Na konkretnim primerima to bi značilo: 1) u slučaju kada izračunata razlika telesne mase između dve grupe u uzorku iznosi 1000g, prava razlika vrednosti u populaciji bi se našla u intervalu: izračunata vrednost ±3% ili 1000±30g (970 do 1030g); 2) u slučaju kada izračunata proporcija pušača u uzorku iznosi 40%, prava zastupljenost pušača bi se našla u intervalu: izračunata proporcija ±5% ot te proporcije ili 40±2% pušača (38 do 42%). Granične tablične z i t vrednosti U nekim formulama za izračunavanje veličine uzorka se umesto dozvoljenog nivoa greške tipa I zahteva unos granične tablične z ili t vrednosti. Verovatnoća greške tipa II i snaga studije Greška tipa II (β greška) nastaje u situaciji kada istraživač vršeći procenu na osnovu uzorka pogrešno zaključuje da ne postoji značajna razlika između dve grupe, dok bi analiza vršena na celokupnoj populaciji potvrdila da razlika postoji i da je statistički značajna. Drugim rečima, nultu hipotezu bi trebalo odbaciti, ali je zbog zaključivanja na osnovu uzorka ona prihvaćena. Verovatnoća da će prava razlika koja postoji između dve grupe u populaciji biti potvrđena u ispitivanju na uzorku predstavlja snagu studije. Zbir verovatnoće greške tipa II i snage studije iznosi 1 (100%). Ne postoji formalni standard za željenu verovatnoću snage studije, ali većina istraživača kao adekvatnu vrednost prihvata 0,8 (80%). Prema tome, dozvoljeni nivo greške tipa II bi tada iznosio 0,2 (20%). Određivanje snage pre početka studije (a priori) je prihvaćeno od strane većine istraživača i koristi se za izračunavanje adekvatne veličine uzorka. Post-hoc analiza se ponekad koristi da bi se utvrdila snaga već sprovedene studije i korist od ovakve analize je veoma diskutabilna.
7.6.3. Određivanje varijabilnosti ispitivanih obeležja Ključna komponenta svih formula za izračunavanje veličine uzorka je varijabilnost najvažnijeg obeležja ispitivanja. Istraživači pre početka studije ne raspolažu tačnom informacijom o varijabilnosti obeležja koje tek treba da ispituju te su prinuđeni da načine procenu, a za tu svrhu mogu poslužiti tri metode: - Korišćenje dvofaznog uzorka. U prvoj fazi se ispitivanjem obuhvata deo uzorka, odnosno sprovede se pilot istraživanje. Na osnovu prikupljenih podataka iz prve faze odredi se varijabilnost najvažnijeg obeležja i rezultat se uključuje u formulu za izračunavanje adekvatne veličine uzorka, odnosno određuje se broj ispitanika koji je potrebno obuhvatiti studijom u drugoj fazi. Ne postoje preporuke za potrebnu veličinu uzorka u prvoj fazi ispitivanja, ali statistička logika ukazuje da je 30 ispitanika za svaku od analiziranih grupa dovoljan broj. To bi značilo da ukoliko istraživač planira da studijom obuhvati jednu eksperimentalnu i jednu kontrolnu grupu, u prvoj fazi je potrebno analizirati po 30 ispitanika iz obe grupe, ukupno njih 60. Kada je u planu da istraživanje poredi obeležja iz 3 grupe, u prvoj fazi bi bilo obuhvaćeno 90 ispitanika6. 6
U slučajevima kada je u dizajnu studije predviđeno da u okviru grupa postoje podgrupe, pri izračunavanju adekvatne veličine uzorka je svaku od podgrupa potrebno tretirati kao posebnu grupu.
85
- Korišćenje podataka iz predhodnih istraživanja na istoj ili sličnoj populaciji. - Procena varijabilnosti uz pomoć matematičkih procedura. Prve dve metode koriste stvarne podatke i produkuju validne procene varijabilnosti obeležja. Međutim, u nekim istraživanjima nije moguće primeniti nijednu od tih metoda. Tada se za procenu varijabilnosti obeležja mora primeniti treći metod, odnosno sprovesti matematičko izračunavanje. Objasnićemo dve najjednostavnije procedure i to za procenu varijabilnosti dihotomnih kategorijskih obeležja, kao i numeričkih obeležja čija se vrednost dobija na osnovu stepenovanih skala. Kada je najvažnije obeležje ispitivanja dihotomna promenljiva (muški-ženski pol, oboleo-zdrav i sl.) varijansa za svaki od dva modaliteta obeležja izračunava se jednostavnim kvadriranjem proporcije tog modaliteta. Kako su nam pre ispitivanja proporcije modaliteta nepoznate, preporučuje se da predpostavljena proporcija svakog od dva modaliteta obeležja u populaciji bude 0,5 (50%). Time se dobija maksimalna vrednost varijanse, a samim tim i maksimalna potrebna veličina uzorka, odnosno izbegava se mogućnost da uzorak bude manji od potrebnog. Prema tome, u slučajevima kada nismo u mogućnosti da na drugi način procenimo varijabilnost dihotomnog obeležja, kao predpostavljenu varijansu svakog od dva modaliteta koristimo vrednost od 0,25 (0,52=0,25 ili 25%). U slučaju kada je najvažnije obeležje ispitivanja numeričko obeležje čija se vrednost dobija na osnovu skale, u proceni varijanse prvo je potrebno definisati broj stepenova skale. Na primer, ako je najvažnije obeležje ispitivanja subjektivno zdravstveno stanje, a ono se procenjuje na osnovu odgovora datih na pitanje iz upitnika: "Ocenite svoje zdravlje ocenom od 1 do 10", broj stepenova skale iznosi 10. Zatim se broj stepenova skale podeli sa 6 jer se predpostavlja da će po 3 standardne devijacije sa svake strane stvarne srednje vrednosti skale, ma kolika ona bila, obuhvatiti 99% odgovora koji bi se dobili kada bi cela populacija bila obuhvaćena ispitivanjem. Izračunati količnik predstavlja standardnu devijaciju skale, a kvadrat količnika je varijansa skale. U našem primeru desetostepene skale, procenjena standardna devijacija skale bi iznosila 10/6=1,67, a varijansa 1,672=2,79.
7.6.4. Obuhvat uzorka istraživanjem U nekim slučajevima je prilikom izračunavanja adekvatne veličine uzorka potrebno unapred uzeti u obzir mogućnost da sve odabrane osobe neće pristati da učestvuju u ispitivanju. To se najčešće događa pri anketiranju. Sličan problem nastaje i kada neki ispitanici odustanu u toku samog istraživanja ili iz njega moraju da budu isključeni iz raznih razloga (predomisle se, razbole se i td.). Zbog ovakve mogućnosti deo autora pri izračunavanju veličine uzorka dodaje određen procenat potrebnih ispitanika (oversampling). Ukoliko se odluči na povećanje uzorka istraživaču stoje na raspolaganju dve logične i prihvatljive metode, koje su u osnovi slične kao i pri određivanju varijabilnosti najvažnijeg obeležja, a to su: a) korišćenje dvofaznog uzorka - pilot studije i b) korišćenje podataka iz predhodnih istraživanja na istoj ili sličnoj populaciji. Za razliku od procene varijabilnosti uz primenu matematičkih procedura, procena obuhvata nema izgrađene egzaktne metode i nije preporučljiva.
86
7.7. Određivanje adekvatne veličine uzorka 7.7.1. Aritmetička sredina ili proporcija osnovnog skupa Postoje brojne formule za izračunavanje adekvatne veličine uzorka na osnovu čije aritmetičke sredine ili proporcije za neko obeležje bi se vršila procena kolika je stvarna aritmetička sredina ili proporcija tog obeležja u celokupnoj populaciji. One zahtevaju predhodno izračunavanje standardne devijacije vrednosti obeležja na pilot uzorku i ovakvo određivanje varijabilnosti se može smatrati validnim jer koristi stvarne podatke. Međutim, u formule je potrebno uneti i procenjeno odstupanje srednje vrednosti uzorka od stvarne aritmetičke sredine u populaciji ili procenjenu proporciju javljanja neke pojave, a njih ne znamo, odnosno na osnovu uzorka i želimo da ih odredimo. Ovakav postupak je već diskutabilan. Zbog toga je od strane mnogih istraživača prihvaćen jednostavniji način određivanja adekvatnog uzorka za procenu aritmetičke sredine ili proporcije osnovnog skupa, a to je korišćenje tabela i nomograma. Tabela za određivanje veličine uzorka na osnovu veličine populacije predložena od strane Bartleta, Kotrlika i Higinsa Veličina uzorka Numerički podaci Kategorijski podaci Veličina (margina greške=0,03) (margina greške=0,05) populacije p=0,05 p=0,01 p=0,05 p=0,01 t=1,96 t=2,58 t=1,96 t=2,58 100 55 68 80 87 200 75 102 132 154 300 85 123 169 207 400 92 137 196 250 500 96 147 218 286 600 100 155 235 316 700 102 161 249 341 800 104 166 260 363 900 105 170 270 382 1000 106 173 278 399 1500 110 183 306 461 2000 112 189 323 499 4000 119 209 362 598 6000 119 209 362 598 8000 119 209 367 613 10000 119 209 370 626 Primeri: a) Želimo da utvrdimo prosečnu vrednost indeksa radne sposobnosti kod 43 radnika iz neke firme. Kolika je adekvatna veličina uzorka?
87
U tabeli je najmanja veličina populacije 100. Za ovu, kao i za manje populacije potrebna veličina uzorka za numeričke podatke i za nivo greške procene manji od 0,05 iznosi 55, a za nivo greške procene manji od 0,01 adekvatna veličina uzorka je 68 ispitanika. Međutim, kako je broj zaposlenih u firmi manji od 55, ispitivanje je potrebno sprovesti na svim radnicima. b) Kolika je adekvatna veličina uzorka za procenu prosečnog broja eritrocita kod 350 učenica jedne srednje škole? Kako u tabeli nemamo veličinu populacije od 350 koristićemo prvu veću vrednost, a to je 400. Za numeričke podatke i za nivo greške procene manji od 0,05 potrebna veličina uzorka je 92 učenice, a za nivo greške procene manji od 0,01 adekvatna veličina uzorka je 137 učenica. c) Kolika je adekvatna veličina uzorka za procenu prosečne gustine kostiju kod 10450 žena starih od 50 do 54 godine u nekom gradu? Populacija prevazilazi najveću vrednost u tabeli koja iznosi 10000. Međutim, uočavamo da se za numeričke podatke potrebna veličina uzorka ne menja sa porastom veličine populacije već od 4000. Prema tome, za nivo greške procene manji od 0,05 potrebna veličina uzorka je 119 žena, a za nivo greške procene manji od 0,01 adekvatna veličina uzorka je 209 žena. d) Koja je potrebna veličina uzorka za procenu zastupljenosti hipertenzije kod 1650 lekara na nekom okrugu? Kako u tabeli nemamo veličinu populacije od 1650 koristićemo prvu veću vrednost, a to je 2000. Za kategorijske podatke i za nivo greške procene manji od 0,05 potrebna veličina uzorka je 323 lekara, a za nivo greške procene manji od 0,01 adekvatna veličina uzorka je 499 lekara.
7.7.2. Procena razlike između dve srednje vrednosti Najjednostavnija formula za izračunavanje potrebne veličine uzorka za procenu razlike između dve srednje vrednosti glasi: t 2 SD12 SD22 Formula broj 1 n 2 x1 - x 2
gde je: n - broj statističkih jedinica, t - granična tablična t vrednost, SD12 - standardna devijacija prvog uzorka,
SD22 - standardna devijacija drugog uzorka, x1 - aritmetička sredina prvog uzorka, x 2 - aritmetička sredina drugog uzorka. Primer: Potrebno je da uporedimo efikasnost dva leka – A i B u lečenju arterijske hipertenzije u studiji koja će trajati 3 meseca. Želimo nivo pouzdanosti pri zaključivanju veći od 95%, odnosno dopuštamo nivo greške tipa I manji od 5%. Kao glavni pokazatelj istraživanja definišemo razliku u visini pritiska pre početka primene terapije i na kraju istraživanja. Koja je potrebna veličina uzorka?
88
Rešenje: I Pored vrste terapije, na visinu krvnog pritiska utiču i mnogi drugi faktori, od kojih su najpoznatiji: starija životna dob, gojaznost, pol, konzumiranje alkoholnih pića, nedovoljna fizička aktivnost, povećan unos kuhinjske soli, nizak nivo kalijuma u ishrani, pušenje i pozitivna porodična anamneza. Najjednostavniji način za kontrolu uticaja svih navedenih faktora je uparivanje ispitanika poređenih grupa u odnosu na ispoljenost tih faktora, odnosno primena uparenih uzoraka (matched samples). Na taj način će jedina razlika između grupa biti u leku koji će koristiti, a zaključak o efikasnosti lekova A i B će biti validan. II Da bi mogli da primenimo formulu za izračunavanje adekvatne veličine uzorka neophodne su nam prosečne vrednosti najvažnijeg obeležja ispitivanja, kao i njegove standardne devijacije za obe poređene grupe. Kako tim podacima ne raspolažemo, potrebno je u prvoj fazi sprovesti pilot studiju. Već je navedeno da je 30 ispitanika za svaku od poređenih grupa dovoljan broj u prvoj fazi ispitivanja. III Sproveli smo pilot studiju na dve grupe od po 30 ispitanika. U prvoj grupi, koja je u terapiji koristila lek A, prosečna razlika u visini pritiska pre početka primene terapije i na kraju istraživanja je iznosila 22mmHg sa standardnom devijacijom od 7mmHg, a u drugoj grupi, koja je dobijala lek B, 25mmHg sa standardnom devijacijom od 9mmHg. IV Za verovatnoću greške tipa I od 5%, odnosno za nivo pouzdanosti od 95% i za stepen slobode od 58 (s.s.=n1+n2-2=30+30-2=58) granična tablična t vrednost je 2,0. V Sada raspolažemo vrednostima svih parametara potrebnih za izračunavanje adekvatne veličine uzorka i unesemo ih u formulu: t 2 SD12 SD22 22 7 2 92 4 49 81 57,8 58 n 2 2 9 22 - 25 x1 - x 2
Potrebno je ispitati 58 pacijenata iz osnovnog skupa obolelih od hipertenzije koji u terapiji koriste lek A i 58 pacijenata koji u terapiji koriste lek B, odnosno adekvatna veličina ukupnog uzorka iznosi 116 statističkih jedinica. Kako smo već ispitali po 30 pacijenata, u drugoj fazi istraživanja je neophodno ispitati još po 28 pacijenata.
7.7.3. Procena razlike između dve proporcije Najkorišćeniju formulu za izračunavanje potrebne veličine uzorka za procenu razlike između dve proporcije predložio je Flejs i ona glasi: p q p2 q2 2 Formula broj 2 2 nC 1 1 2 p1 - p2 p1 - p2 gde je: C – konstanta, p1 – proporcija javljanja neke pojave u prvoj grupi (od 0 do 1), q1 – proporcija nepojavljivanja te pojave u prvoj grupi (q1=1-p1), p2 – proporcija javljanja pojave u drugoj grupi, q2 – proporcija nepojavljivanja pojave u drugoj grupi (q2=1-p2),
89
Vrednost konstante C zavisi od dozvoljenog nivoa grešaka tipa I i II: Nivo greške tipa I Nivo greške tipa II 0,05 0,01 0,20 7,85 11,68 0,10 10,51 14,88 Primer: Želimo da uporedimo učestalost gojaznosti kod gradske i seoske dece starosti od 8 do 11 godina. Dopuštamo nivo greške tipa I manji od 0,05, a nivo greške tipa II od 0,20. Potrebno je odrediti adekvatnu veličinu uzorka. Rešenje: I Da bi mogli da primenimo formulu potrebne su nam učestalosti prekomerne telesne težine kod gradske i seoske dece. Kako tim podacima ne raspolažemo, neophodno je u prvoj fazi sprovesti pilot studiju. Kako želimo da ispitujemo zastupljenost pojave koja nije retka, smatramo da je 30 ispitanika za svaku od poređenih grupa dovoljan broj u prvoj fazi ispitivanja. II Sproveli smo pilot studiju na dve grupe od po 30 ispitanika. Kod gradske dece gojaznost je potvrđena u 6 (20,0%), a kod seoske u 4 (13,33%) slučaja. Prema tome, proporcija kod gradske dece iznosi p1=0,20, a kod seoske p2=0,13. Odatle: q1=1p1=1-0,20=0,80, a q2=1-p2=1-0,13=0,87. III Vrednost konstante C za željeni nivo greške tipa I manji od 0,05 i nivo greške tipa II od 0,20 iznosi: C=7,85. IV Unesemo sve potrebne vrednosti u formulu za izračunavanje veličine uzorka: 0, 20 0,80 0,13 0,87 2 n 7,85 2 468,09 468 2 0, 20 0,13 0, 20 0,13 Potrebno je ispitati 468 deteta iz gradske i 468 iz seoske sredine. Kako smo već ispitali po 30 deteta, u drugoj fazi istraživanja je neophodno ispitati još po 438 deteta.
7.7.4. Poređenje više od dve grupe ispitanika Najjednostavniji način za određivanje potrebne veličine uzorka u slučajevima kada poredimo tri i više grupa ispitanika je definisanje dve grupe koje su nam najvažnije u istraživanju. Tada ćemo za izračunavanje veličine uzorka primeniti jednu od već prikazanih metoda kada poredimo dve grupe ispitanika, a u zavisnosti od toga da li poredimo numeričke vrednosti ili proporcije. U formule uključujemo vrednosti parametara dve najvažnije grupe, a izračunati broj potrebnog broja ispitanika primenjujemo za sve poređene grupe. Primer: Želimo da poredimo učestalost gojaznosti kod učenika osnovnih škola, srednjih škola i studenata. Rešenje: I Definišemo da su nam rezultati kod učenika osnovnih i srednjih škola značajniji nego oni kod studenata i izvršimo pilot studiju sa po 30 ispitanika iz ove dve grupe. II Unesemo parametre dobijene iz pilot studije u formulu za izračunavanje veličine uzorka za procenu razlike između dve proporcije (formula broj 2). Ako je
90
rezultat formule, na primer 50, zaključujemo da je potreban broj ispitanika za sve tri grupe po 50, a kako smo već ispitali po 30 učenika osnovnih i srednjih škola u drugoj fazi studije ćemo analizirati 50 studenata i po 20 učenika osnovnih i srednjih škola. III Kada bi nam glavni pokazatelj istraživanja bio numerička vrednost indeksa mase tela (BMI), tada bi njene prosečne vrednosti i standardne devijacije za učenike osnovnih i srednjih škola dobijene na osnovu podataka iz pilot studije uneli u formulu za izračunavanje veličine uzorka za procenu razlike između dve srednje vrednosti (formula broj 1).
7.7.5. Zavisni uzorci U situacijama kada ista grupa ispitanika predstavlja i eksperimentalnu i kontrolnu grupu, odnosno kada se na njoj vrši ispitivanje pre i posle protoka određenog vremena (najčešće pre i posle neke intervencije), govorimo o zavisnom uzorku. Zaključivanje na osnovu zavisnog uzorka ima veću pouzdanost nego zaključivanje na osnovu nezavisnih uzoraka jer se pri tome vrši mnogo bolja kontrola svih individualnih pridruženih faktora, koji se za vreme studije ne menjaju ili su promene neznatne (nasleđe, starost, težina, pušenje, konzumiranje alkoholnih pića, školska sprema, socijalni status...). Zbog toga je i potrebna veličina zavisnih uzoraka manja nego veličina nezavisnih uzoraka.7 Snedekor i Kohran su predložili formulu za izračunavanje adekvatne veličine zavisnog uzorka za slučaj kada je glavno obeležje ispitivanja kontinuirana numerička promenljiva: 2
SD Formula broj 3 n 2 C x gde je: n - broj statističkih jedinica, SD - standardna devijacija razlika nastalih između dva merenja,
x - aritmetička sredina razlika nastalih između dva merenja, C - konstanta (sa vrednostima koje se primenjuju u formuli br. 2). Primer: Želimo da utvrdimo da li će se stepen depresivnosti kod obolelih od angine pektoris, izražen kroz vrednosti skale za depresivnost, značajno umanjiti u toku tri meseca ukoliko se u terapiju uvede lek A. Koja je potrebna veličina uzorka za dozvoljeni nivo greške tipa I manji od 0,05, a nivo greške tipa II od 0,10? Rešenje: I Sproveli smo pilot studiju u kojoj je učestvovalo 30 obolelih od angine pektoris. Izračunali smo da je prosečno umanjenje vrednosti skale kod njih posle uvođenja leka A u terapiju iznosilo 0,81, a standardna devijacija tog umanjenja je bila 1,66. 7
Ova metoda se odnosi na situacije kada je u studijama analizirana samo jedna grupa ispitanika pre i posle neke intervencije, a cilj ispitivanja je da se utvrdi da li intervencija izaziva značajne promene vrednosti nekog obeležja. Metod se ne odnosi na situacije kada studija obuhvata dve ili više grupa ispitanika, a cilj je da se utvrdi da li se promene vrednosti nekog obeležja nastale usled intervencije značajno razlikuju između poređenih grupa. U takvim slučajevima se adekvatna veličina uzorka određuje primenom formule broj 1 u koju se unose prosečne razlike vrednosti pre i posle intervencije, kao i standardne devijacije tih razlika, za svaku od poređenih grupa.
91
II Vrednost konstante C za željeni nivo greške tipa I manji od 0,05 i nivo greške tipa II od 0,10 iznosi: C=10,51. III Unesemo sve potrebne vrednosti u formulu za izračunavanje veličine uzorka: 2
1,66 n 2 10,51 46,14 46 0,81 Prema tome, potrebna veličina uzorka je 46 obolelih. Kako smo već ispitali 30 pacijenata, neophodno je u drugoj fazi studije ispitati još njih 16.
7.7.6. Korelaciona i regresiona analiza Postoje formule za izračunavanje veličine uzorka kada je potrebno ispitati da li između različitih numeričkih obeležja u jednoj grupi ispitanika postoji značajna korelacija. Međutim, u ove formule je potrebno uneti vrednost unapred predpostavljenog koeficijenta korelacije, što je u velikom broju slučajeva veoma diskutabilno. Zbog toga je, umesto korišćenja ovakvih formula, definisano nekoliko pravila za određivanje neophodnog broja ispitanika kako bi rezultat korelacione ili regresione analize bio validan, a u ovom priručniku navodimo ona koja se najčešće primenjuju, kako za univarijantnu, tako i za multivarijantnu analizu: a) Najpoznatije pravilo predlaže po 20 ispitanika za svaku nezavisno promenljivu uključenu u analizu. To znači da je za utvrđivanje korelacije između dva obeležja dovoljno 20 ispitanika. Ukoliko pak želimo da procenimo uticaj, na primer 3 nezavisno promenljive na zavisno promenljivu primenom multivarijantne regresione analize potrebno je istraživanje sprovesti na: n=3x20=60 ispitanika. b) Prema Tabakniku i Fidelu za regresionu analizu je istraživanje potrebno sprovesti na: n=104+m ispitanika, gde je m broj nezavisno promenljivih. Prema ovom pravilu bi za univarijantnu analizu bilo neophodno: n=104+1=105 ispitanika, a za multivarijantnu sa 3 nezavisno promenljive: n=104+3=107 ispitanika. c) Kada nam je u regresionoj analizi značajno i tumačenje vrednosti koeficijenta determinacije (R2), odnosno kada želimo da procenima koliki procenat varijabilnosti vrednosti zavisno promenljive je uzrokovan promenama vrednosti nezavisno promenljivih koje su uključene u multivarijantni model, potreban broj ispitanika iznosi: n=50+8m. To bi značilo da je za univarijantnu analizu neophodno: n=50+8x1=58 ispitanika, a za multivarijantnu sa 3 nezavisno promenljive: n=50+8x3=74 ispitanika.
7.7.7. Analiza vremena do nastanka događaja (analiza preživljavanja) Analiza vremena do nastanka nekog događaja (engleski: survival analyse), kao što su povrede, ozdravljenja, dostizanje željenog rezultata i sl., uključuje složene statističke modele, kao što su životne tabele (life tables), Kaplan-Majerova metoda ili Koksova regresiona analiza, ali izračunavanje adekvatne veličine uzorka za ovakva ispitivanja je relativno jednostavno. I u ovim slučajevima je u prvom koraku potrebno odrediti proporcije nastupanja događaja kod ispitanika u poređenim grupama, a zatim te proporcije uneti u formulu broj 2. Kako su ovo najčešće prospektivne studije, a vreme
92
praćenja može trajati i nekoliko godina, racionalnije je koristiti podatke iz predhodnih studija nego sprovoditi dugotrajno pilot istraživanje. Drugi metod podrazumeva unošenje prosečne dužine i standardne devijacije vremena do nastupanja događaja kod dve poređene grupe u formulu broj 1. Ovakav pristup, međutim, zahteva da praćenje mora da traje dok događaj ne nastupi kod svih ispitanika u obe grupe. To takođe znači da je verovatnoća da će događaj nastupiti kod svih ispitanika 100%, pa je metod primenljiv samo kod ispitivanja gde je očekivani događaj izvestan (na primer, ozdravljenje ili oporavak kod lakših bolesti ili povreda). Primer: Želimo da ispitamo da li vrsta fizikalne terapije (A ili B) značajno utiče na dužinu oporavka posle moždanog udara. Pri dizajnu studije određujemo da će vreme praćenja iznositi 10 meseci. Osim vrste terapije želimo da procenimo da li na oporavak značajno utiču i drugi faktori, kao što su: starost, pol, BMI i td. Prema tome, primenićemo Kaplan-Majer-ovu i Koksovu regresionu analizu. Dopuštamo nivo greške tipa I manji od 0,05, a nivo greške tipa II od 0,20. Rešenje: I Kako vreme praćenja iznosi 10 meseci, a pri tome i ne očekujemo da će potpuni oporavak nastupiti kod svih ispitanika, racionalnije je da umesto sprovođenja pilot studije za određivanje adekvatne veličine uzorka koristimo rezultate predhodnih istraživanja. II Konsultujemo literaturu i nalazimo da primena terapije A dovodi do zadovoljavajućeg oporavka kod oko 60% pacijenata (p1=0,60), dok primena terapije B dovodi do oporavka kod oko 70% ispitanika (p2=0,70) u periodu primene od 10 meseci. Odatle: q1=1-p1=1-0,60=0,40, a q2=1-p2=1-0,70=0,30. III Vrednost konstante C za željeni nivo greške tipa I manji od 0,05 i nivo greške tipa II od 0,20 iznosi: C=7,85. IV Unesemo sve potrebne vrednosti u formulu broj 2: nC
p1 q1 p2 q2 p1 - p2
2
2 0,6 0, 4 0,7 0,3 2 2 7,85 2 375, 25 375 2 p1 - p2 0,6 - 0,7 0,6 - 0,7
Prema tome, validne zaključke o uticaju vrste terapije na dužinu oporavka posle moždanog udara dobićemo ukoliko u istraživanje uključimo dve grupe od po 375 pacijenata.
7.7.8. Korišćenje nomograma Nomogrami predstavljaju grafičke prikaze numeričkih relacija. Njihova primena je raznovrsna, a između ostalog, konstruisani su i mnogi nomogrami za brzo određivanje adekvatne veličine uzorka. U ovom priručniku prikazaćemo primenu nomograma koji je 1985. godine prezentovao stručnoj javnosti dr Relja Petrović, lekar tadašnjeg Zavoda za zaštitu zdravlja u Nišu. On se može koristiti za utvrđivanje velikih slučajnih nestratifikovanih uzoraka za procenu srednje vrednosti ispitivanih obeležja u osnovnom skupu. Nomogram se preporučuje zbog jednostavne primene i stručne opravdanosti njegove upotrebe. Sastoji se od mreže konstruisane između dveju logaritamskih osa – apscise, na kojoj je predstavljena populacija, i ordinate, na kojoj je procenat optimalnog uzorka, i linije nomograma koja određuje granicu. Upotreba: Za određivanje veličine uzorka za zadatu populaciju stanovnika potrebno je na apscisi pronaći tačku koja označava tu populaciju, zatim podići vertikalu
93
do nomogramske linije, a onda vratiti ulevo do ordinate i pročitati procenat zahvata na ordinati. Nomogram za odredjivanje optimalnog uzorka 100
Uzorak (% zahvata)
10
1
0.1
0.01 10
100
1000
10000
100000
1000000
Populacija
10000000
100000000
1000000000
Autor: Dr Relja Petrović
Primer: Potrebno je odrediti adekvatnu veličinu uzorka za procenu dugotrajnog delovanja aerozagađenja na zdravlje u gradu čija populacija broji 250000 stanovnika. Rešenje: Na apscisi pronađemo tačku koja označava populaciju od 250000 stanovnika. Podižemo vertikalu do nomogramske linije, a onda vratimo ulevo do ordinate i očitavamo procenat koji iznosi 1,5%. To praktično znači da za populaciju od 250000 stanovnika optimalni uzorak iznosi 1,5%, odnosno 3750 ispitanika. Nomogram za odredjivanje optimalnog uzorka 100
Uzorak (% zahvata)
10
1
0.1
0.01 10
100
1000
10000
100000
Populacija
94
1000000
10000000
100000000
1000000000
Autor: Dr Relja Petrović
7.7.9. Internet kalkulatori Na internetu se mogu naći brojni kalkulatori za izračunavanje adekvatne veličine uzorka, praktično za sve načine testiranja nulte hipoteze: poređenja numeričkih vrednosti i proporcija, regresione analize, analizu varijanse, ponovljena merenja, analizu preživljavanja i td. Upotreba većine ovih kalkulatora je danas besplatna. Svi oni sadrže kraća uputstva za primenu, a deo njih i formule po kojima se vrši izračunavanje. Da bi mogli biti primenjeni u kalkulatore je potrebno uneti statističke parametre za glavne promenljive u istraživanju (srednje vrednosti, standardne devijacije, proporcije), kao i dozvoljeni nivo greške tipa I i II, odnosno željeni nivo pouzdanosti i snagu studije. Kao i za primenu formula navedenih u ovom udžbeniku, i za internet kalkulatore je neophodno do statističkih parametara glavne promenljive doći na osnovu pilot istraživanja ili na osnovu rezultata predhodnih istraživanja. Ovde će biti prikazana primena samo jednog internet kalkulatora, pod nazivom Istraživačev komplet alata (Researcher's toolkit), što nikako ne predstavlja isključivu preporuku autora jer je izbor zaista veoma veliki. Ovaj kalkulator se može primeniti za izračunavanje potrebne veličine uzorka za procenu srednje vrednosti ili proporcije osnovnog skupa, kao i za poređenje srednjih vrednosti ili proporcija između dve grupe ispitanika, a nalazi se na adresi: http://www.dssresearch.com/toolkit/sscalc/size.asp. Procena razlike između dve srednje vrednosti
Primer: Želimo da uporedimo indeks radne sposobnosti kod radnika u odnosu na nivo školske spreme: visoka - srednja/viša. Procenu vršimo primenom skale čije su vrednosti od 7 (slab) do 49 (odličan). Pilot studija sprovedena na dve grupe od po 30 ispitanika je pokazala da kod radnika sa visokom školskom spremom prosečan indeks radne sposobnosti iznosi 40±6, a 95
kod onih sa srednjom i višom školskom spremom 42±4. Definisali smo dozvoljeni nivo greške tipa I (α greška) od 5%, a greške tipa II (β greška) od 20%. Rešenje: Izaberemo opciju Averages (aritmetičke sredine), Two Samples (dva uzorka) i unesemo potrebne statističke parametre u predviđena polja kalkulatora. Pritiskom na taster Calculate Sample Size (izračunaj veličinu uzorka) dobijamo da je potrebno ispitati 80 radnika sa visokom i 80 sa srednjom ili višom školskom spremom (veličina uzorka iznosi 80 za oba uzorka – Sample Size = 80 for both samples!). Kako smo već ispitali po 30 radnika, u drugoj fazi istraživanja je neophodno ispitati još po 50. Procena razlike između dve proporcije
Primer: Želimo da uporedimo procenat korišćenja psihoaktivnih supstanci kod učenika srednjih škola i studenata. Sproveli smo pilot istraživanje na dve grupe od po 30 ispitanika i korišćenje psihoaktivnih supstanci je potvrđeno od strane 2 (6,7%) učenika i 3 (10,0%) studenta. Dopuštamo nivo α greške manji od 5% (nivo pouzdanosti u zaključivanju je tada veći od 95%), a nivo β greške manji od 20% (snaga studije je tada veća od 80%). Rešenje: Izaberemo opciju Percentages (procenti), Two Samples (dva uzorka) i unesemo potrebne statističke parametre u predviđena polja kalkulatora. Pritiskom na taster Calculate Sample Size (izračunaj veličinu uzorka) dobijamo:
Potrebno je ispitati dve grupe od po 868 ispitanika. Kako smo već ispitali po 30, u drugoj fazi istraživanja je neophodno ispitati još 838 učenika i 838 studenata.
96
8. OSNOVE KORIŠĆENJA PROGRAMSKOG PAKETA SPSS Programski paket SPSS (Statistical Package for Social Sciences), koji od verzije 17.0 ima naziv PASW (Predictive Analytics SoftWare) ima sledeće komponente: 1. Programe koji: učitavaju podatke, izvode analize i daju ispise rezultata 2. Fajlove sa podacima (.sav) 3. Fajlove sa ispisima (.spo) i 4. Komandne tj. sintaksne fajlove (.sps) Program se pokreće iz Start menija komandama: All Programs/SPSS for Windows/SPSSxx.x for Windows (za verzije do 17.0) ili All Programs/SPSS inc/PASW Statisticsxx (za verzije od 17.0)
Iz programa se izlazi klikom na znak X (u gornjem desnom uglu) ili odabirom komandi File pa Exit iz menija programa. Pokretanjem programa otvara se Glavni prozor, koji se sastoji od tabele za podatke, menija programa sa komandama od File do Help i nekoliko komandnih ikona.
97
Podaci se unose u tabelu, odnosno matricu reda nm u kojoj su redovi ispitanici, slučajevi, entiteti ili jedinice posmatranja, a kolone su obeležja, svojstva, atributi, tj. varijable. Pojedine kolone ili redovi nazivaju se vektori. Podaci se mogu upisivati direktno u tabelu, ali ih je moguće i učitati iz standardnih baza podataka (Excel, Dbase, Access...) ili iz bilo kojeg standardnog editora, ukoliko su sačuvani u ASCII formatu (American Standard Code for Information Interchange). Tabela editora podataka podeljena je u redove koji su označeni brojevima i kolone koje su označene sa var. Da bi počeli unos podataka potrebno je predhodno kreirati i definisati varijable. Kliknuti mišem na naslov prve kolone var, a zatim desnim klikom miša otvoriti skraćeni meni. Izborom opcije Insert Variable naziv kolone se menja u var00001, a u ovako kreiranu varijablu je sada moguće unositi podatke.
Glavni prozor SPSS programa se sastoji od dva radna lista koji se nalaze jedan iznad drugoga. List koji vidimo kada pokrenemo program i koji smo do sada opisivali naziva se Data View - Pogled na podatke. List u kome se vrši definisanje varijabli naziva se Pogled na varijable – Variable View. Njega pokrećemo klikom na jezičak u donjem levom uglu Glavnog prozora.
Po automatizmu SPSS novoformiranoj varijabli dodeljuje naziv var00001, definiše je kao numeričku, određuje joj širinu od 8 cifara sa još dva decimalna mesta i daje joj desno poravnanje.
98
Svaku od ovih karakteristika možemo promeniti prema svojim potrebama i namerama. Naziv varijable možemo promeniti kada mišem kliknemo na ćeliju sa već zadatim imenom var00001. Naziv može sadržati slova (samo engleska) i brojeve, ali mora početi slovom. U starijim verzijama programa naziv je mogao sadržati do 8 slovno-brojnih oznaka, dok novije verzije podržavaju do 41 oznake. Naziv ne sme sadržati prazna mesta, slova ć, č, ž, š i đ, kao i simbole (/, *, !, $, %, &, =, ?, +, -....). Definisanje tipa varijable (numerička, tekst - string, datum ...) vrši se u ćeliji Type, širine u ćeliji Width, a broja decimalnih mesta u ćeliji Decimals. Varijable tipa String ne mogu se koristiti u računanju. Preporučljivo je da se kvalitativne (kategorijske) varijable kodiraju numerički. Na primer, bolje je umesto kategorija MUŠKI i ŽENSKI u varijabli POL unositi cifre 1 i 2 ili 0 i 1. Label – služi za preciznije definisanje oznake varijable. Ova oznaka može sadržati prazna mesta, odnosno odvojene reči i zbog toga se u ispisu rezultata pojavljuje umesto imena varijable upisanog u polje Name. Kada je polje Label prazno u ispisu rezultata se pojavljuje naziv upisan u polju Name. Na primer, kao Name možemo upisati: OKZ, a kao Label: Skor objektivnog kvaliteta zivota. U polju Value (vrednost) mogu se definisati značenja kodova koji su dodeljeni pojedinim kategorijama kvalitativnih varijabli. Na primer, ukoliko smo u varijabli POL kategoriji MUŠKI dodelili kod 1, a kategoriji ŽENSKI kod 2, da ne bi pamtili šta koji kod znači, a i da bi se adekvatni nazivi kategorija pojavili u ispisu rezultata, kliknemo mišem na polje Value i otvara se sledeći dijalog prozor:
99
U polje Value upisuje se vrednost koda 1, a u polje Value Label (oznaka vrednosti) upisuje se značenje koda, u ovom slučaju MUSKI. Klikom na Add (dodaj) ova definicija oznake vrednosti koda će biti potvrđena i uneta u prostor na dnu dijalog prozora. Proceduru ponovimo i za kod 2, odnosno kategoriju ZENSKI. Dijalog prozor zatvaramo klikom na Continue (nastavi). Ukoliko želimo da izmenimo neku od definicija naziva vrednosti koda, kliknemo na nju, načinimo ispravku u poljima Value i Value Label, a zatim kliknemo na Change (izmeni).
Uklanjanje neke od definicija naziva vrednosti koda vrši se tako što kliknemo na nju, a zatim na komandu Remove (ukloni). Missing – služi za definisanje nedostajućih podataka. Column – služi za definisanje formata ispisa varijable u tabeli. Measure – omogućava definisanje merne skale sa koje dolaze podaci na datoj varijabli. Posle definisanja varijabli klikom na prvu ćeliju možemo pristupiti unosu podataka. Na druge ćelije prelazimo ili strelicama za pomeranje kurzora ili klikom miša na njih. Uneti podaci se trajno zapisuju naredbom Save (sačuvaj) iz File menija. Pri prvom zapisivanju pokreće se opcija Save As... (sačuvaj kao) i tom prilikom je potrebno dati ime fajlu sa podacima. Preporuke Prva kolona u tabeli bi trebalo da sadrži redni broj statističke jedinice. Druga kolona bi trebalo da sadrži oznaku grupe u kojoj se nalazi statistička jedinica. Ukoliko grupe sadrže podgrupe, potrebno je uvesti posebnu kolonu “Podgrupa”. Svaka podgrupa ima svoju posebnu oznaku. Uvođenje većeg broja podgrupa umanjuje snagu zaključivanja jer standardna greška zavisi od veličine uzorka, a pri poređenju vrednosti nekog obeležja između različitih podgrupa, svaka od njih se podrazumeva kao poseban uzorak.
100
Učitavanje podataka iz standardnih baza
Biramo: File/ Open/ Data...
Otvara se prozor Open File. U polju Files of type iz padajućeg menija biramo tip baze u kojoj su traženi podaci, a u polje File name upisujemo njeno ime. Komandom Open podaci se učitavaju u prozor za podatke SPSS programa.
101
9. STUDENTOV T-TEST U poglavlju o testiranu hipoteza smo naveli da parametrijske statističke testove možemo da primenimo u onim slučajevima kada su vrednosti ispitivanog obeležja date numerički, odnosno kada su izmerene intervalnom ili skalom odnosa i kada od parametara možemo da izračunamo aritmetičku sredinu, varijansu, standardnu devijaciju i standardnu grešku. Drugi uslov za njihovu primenu je da je raspored vrednosti unutar skupova iz kojih su dobijeni uzorci normalan ili pak uzorci moraju da budu veći od 30 jedinica. Studentov t-test je parametrijski test koji se koristi za procenu statističke značajnosti razlike između dve aritmetičke sredine. Postoji šest tipova t – testa: t – test razlike između aritmetičke sredine osnovnog skupa i uzorka t – test razlike između aritmetičkih sredina dva mala nezavisna uzorka t – test razlike između aritmetičkih sredina dva mala zavisna uzorka t – test razlike između aritmetičkih sredina dva velika nezavisna uzorka t – test razlike između aritmetičkih sredina dva velika zavisna uzorka t – test proporcije Primenom svakog od ovih tipova testa izračunava se t-vrednost, koja u osnovi predstavlja količnik razlike između dve aritmetičke sredine i standardne greške procene te razlike, odnosno pokazuje koliko je puta neka razlika veća od sopstvene greške procene. Svaki od ovih tipova ima posebnu formulu za izračunavanje t-vrednosti, ali se sve one mogu uopšteno prikazati kao:
t
X1 X 2 SGX 1 X 2
Za njegovo realizovanje potrebno je poznavati sledeće parametre uzoraka koje poredimo: njihovu veličinu (n), standardnu devijaciju (SD) i aritmetičku sredinu ( X ). Ukoliko se razlike aritmetičkih sredina uzoraka simetrično raspoređuju oko prave razlike u populaciji, onda je logično da i njihove standardne greške imaju normalan raspored oko prave greške, pa mogu da se aproksimiraju normalnim standardizovanim rasporedom. Tumačenje izračunate (realizovane) t-vrednosti bazira se na poređenju sa graničnim t-vrednostima za odgovarajuću verovatnoću greške procene (prag statističke značajnosti) i stepen slobode, koje se mogu očitati iz tabele graničnih vrednosti trasporeda. U tumačenju izračunate t-vrednosti važe sledeća pravila: - Ako je realizovana t-vrednost manja od granične tablične vrednosti za odgovarajući broj stepena slobode i prag značajnosti, nulta hipoteza se prihvata kao tačna, a odbacuje se alternativna hipoteza. t-realizovano < t(SS i 0,05) Ho se ne odbacuje jer je rizik da smo načili grešku procene veći od 5% (p>0,05)
102
- Ako je realizovana t-vrednost jednaka ili veća od granične tablične vrednosti, za odgovarajući broj stepena slobode i prag značajnosti, nulta hipoteza se odbacuje kao netačna, a prihvata se alternativna hipoteza: t-realizovano t(SS i 0,05) odbacuje se nulta hipoteza za nivo rizika p=0,05, odnosno za nivo sigurnosti P=0,95 (95%) t-realizovano t(SS i 0,01) odbacuje se Ho i za nivo rizika p=0,01, odnosno za nivo sigurnosti P=0,99 (99%). Sa povećanjem uzorka t-raspored se približava standardizovanom normalnom z-rasporedu, i kod velikih uzoraka (n>30 ili n1+n2>60 jedinica) poprima sve osobine ovog rasporeda i t-vrednost se "ponaša" kao z-vrednost. Kod velikih uzoraka gornja pravila o prihvatanju ili neprihvatanju H0 se uprošćavaju i ne zahtevaju primenu tablice Studentovog t-rasporeda, već se zaključivanje zavisno od nivoa dozvoljene granice greške vrši na sledeći način: za p=0,05 Ako se razlika nalazi u intervalu 0±1,96SG nije značajna; t0,05 Ako se razlika nalazi izvan intervala 0±1,96SG značajna je; Ho se odbacuje; p t(20 i 0,05) = 2,09 i p t(20 i 0,01) = 2,84 i p99% i tvrdimo da kod dijabetičara holesterol pokazuje znatno veće vrednosti nego kod zdravih osoba. U SPSS-u se ovaj zadatak radi na sledeći način:
Izaberemo komande: Analyze / Compare Means / One-Sample T Test (Analiza / Poređenje aritmetičkih sredina / t-test za jedan uzorak)
Otvara se radni prozor u kome su sa leve strane nazivi svih varijabli, u ovom slučaju samo HOLESTEROL. Markiramo varijablu i klikom na strelicu prebacimo je u polje Test Variable(s). U polje Test Value upisujemo prosečnu vrednost test varijable u populaciji, u ovom slučaju to je 4,45. Kliknemo na OK
106
U Output-u (ispisu) se dobijaju sledeće tabele: One-Sample Statistics
N holesterol
Mean 21
Std. Deviation
5.8857
0.64287
Std. Error Mean 0.14029
One-Sample Test Test Value = 4.45
holesterol
t 10.234
df
Sig. (2-tailed) 20 .000
Mean Difference 1.43571
95% Confidence Interval of the Difference Lower Upper 1.1431 1.7283
U prvoj ispisnoj tabeli je deskriptivna statistika varijable holesterol u uzorku: N (veličina uzorka) – 21; Mean (aritmetička sredina) – 5,8857; Std. Deviation (SD) – 0,64287 i Std. Error Mean (SG aritmetičke sredine) – 0,14029. U drugoj tabeli prikazani su: izračunata t-vrednost (10,234), broj stepeni slobode (20), p vrednost (0,000), razlika između aritmetičke sredine u uzorku i vrednosti u populaciji (1,43571) i granice 95% intervala poverenja za procenu stvarne razlike, koja bi se dobila kada bi svi dijabetičari bili testirani (donja granica: 1,1431, gornja granica: 1,7283). P vrednost od 0,000 ukazuje da je razlika od 1,43571 statistički značajna na nivou greške procene manjem od 0,1% (p30 ili n1+n2>60 Stepen slobode se određuje po formuli: S.S = n1 + n2 – 2. Primer: Ispitivana je visina holesterola u krvi kod populacije seoskog i gradskog stanovništva. Merenje je izvršeno na slučajnim uzorcima odraslog stanovništva i kod 200 stanovnika sa sela prosečna vrednost holesterola iznosila je X =7,5 mmol/L, a SD = 0,91. Kod 250 ispitanika iz grada prosečna visina holesterola bila je X = 6,73, a SD= 0,85. Da li postoji značajna razlika izmedju proseka visine holesterola kod gradskog i seoskog stanovništva i da li je ona posledica razlike u načinu ishrane ili je posledica slučajnog karaktera? Ho: 7,5 – 6,73 = 0,77 nije statistički značajna razlika Ha: 7,5 – 6,73 = 0,77 je značajna razlika i posledica je različitog načina ishrane
t
X1 X 2 2 1
2 2
SD SD n1 1 n2 1
7,5 6,73 0,912 0,84 2 200 1 250 1
9,16
t = 9,16 > t = 1,96 i p t = 2,58 i p0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu, p0,05, odbacujemo nultu i prihvatamo alternativnu hipotezu. Primer: Od 8 onkoloških bolenika, 4 je lečeno jednom, a 4 drugom vrstom terapije. Od 4 bolesnika lečenih terapijom A umro je 1 bolesnik, a od 4 bolesnika lečenih terapijom B umrla su 2 bolesnika. Da li postoji signifikantna razlika u ishodu lečnja između ove dve terapije?
132
Prvo pravimo tabelu kontigencije: terapija A B ukupno
preživeli 3 2 5
umrli 1 2 3
ukupno 4 4 8
Zatim postavljamo hipoteze: Ho: Nije postojala signifikantna povezanost između vrste terapije i ishoda lečenja. Ha: Postojala je signifikantna povezanost između vrste terapije i ishoda lečenja. Na kraju, izračunavamo p vrednost primenom formule:
p
(3 1)!(2 2)!(3 2)!(1 2)! =0,107 3!1!2!2!8!
Kako je p=0,107 veće od 0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu i zaključujemo da nije postojala signifikantna povezanost između vrste terapije i ishoda lečenja. Fisher-оv test tačne verovatnoće je prvobitno osmišljen za 2x2 tabelu i korišćen je samo kada su očekivane učestalosti bile male. To je zato što su za veće brojeve i veće tabele proračuni bili nepraktični. Sa računarima stvari su se promenile i Fisher-ov test tačne verovatnoće može da se uradi za bilo koju 2x2 tabelu. Neki programi će takođe izračunati Fisher-ov test tačne verovatnoće za veće tabele, dok se broj redova i kolona povećava, broj mogućih tabela raste vrlo brzo i postaje neizvodljivo da se izračuna i sačuva verovatnoća za svaku od njih. Postoje specijalni programi kao što je StatExact koji prave slučajni uzorak mogućih tabela i koriste ih za procenu raspodele verovatnoća. Metode koje uzorkuju mogućnosti na ovaj način zovu se Monte Carlo metode. Bilo je mnogo sporova između statističara o validnosti testa tačne verovatnoće i korekciji kontinuiteta koji ga aproksimira. Problem je i dalje nerešen, a diskusija o ovom problemu je van domašaja ove knjige. Za neke slučajeve Fisher-ov test tačne verovatnoće i Yates-ova korekcija mogu biti konzervativni, odnosno dati veću verovatnoću nego što bi trebalo, mada je ovo stvar rasprave. Stav autora ove knjige je da Yates-ovu korekciju i Fisher-ov test tačne verovatnoće treba koristiti.
10.4. Mc Nemar-ov test Mc Nemar-ov test je u stvari 2 test za dva zavisna uzorka. Njime se utvrđuje da li postoji povezanost između dihotomnih obeležja dva zavisna uzorka. Zavisnost podrazumeva bilo iste jedinice posmatranja u dva vremena (pre i posle nekog tretmana) ili iste jedinice posmatranja podvrgnute dejstvu dva različita tretmana. Obeležja tablice kontigencije su prvo i drugo vreme ili prvi i drugi tretman. Podaci koji se posmatraju mogu biti i parametrijski, ali heterogeni. Primenjuje se na tablice kontigencije 2x2 koja se odnosi na zavisne uzorke. Ishodi u tablici su specifično organizovani:
133
prvo testiranje
drugo testiranje
ukupno
pozitivno
negativno
pozitivno
a
b
a+b
negativno
c
d
c+d
ukupno
a+c
b+d
N=a+b+c+d
Ivični zbirovi nisu bitni za Mc Nemar test. U izračunavanju se koriste one učestalosti u kojima se ogleda razlika pri dva testiranja. U kontigencijskoj tablici je vidljivo da se dobijene razlike nalaze u ćelijama b i c. Empirijska vrednost Mc Nemar-ovog testa predstavlja se preko 2 vrednosti koja se izračunava primenom formule: 2 b c 1 2
bc
Stepeni slobode se izračunavaju kao kod 2 testa: S.S. = (K-1)x(R-1). Tumačenje realizovane vrednosti 2 testa vrši se na osnovu tablica kritičnih vrednosti 2 distribucije. Uslovi za primenu Mc Nemar testa: 1. Ne može se primeniti ako je neka od validnih učestalosti manja od 5. 2. Yates-ova korekcija se primenjuje kada je a+d0,05 Kako je realizovana χ2McN vrednost od 3,02 manja od granične tablične vrednosti, χ2=3,841, za broj stepeni slobode 1 i prag značajnosti od p=0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu jer je greška p>0,05 i zaključujemo da ne postoji statistički značajna razlika između dijagnostičkih metoda I i II U SPSS-u se zadatak radi na sledeći način: Biramo: Analyse / Nonparametric Tests / 2 Related Saples
U radnom prozoru sa leve na desnu stranu prebacimo varijable koje se ukrštaju, a to su „DgI“ za prvu dijagnostičku metodu i „DgII“ za drugu. Zatim odaberemo McNemar.
135
Izda se nalog OK i dobiju se rezultati: DgII & DgI DgI DgII 1 2
1
2 15 25
Test Statistics
40 20
b
DgII & DgI N 100 3.015 Chi-Square a Asymp. Sig. .082 a. Continuity Corrected b. McNemar Test
Prva tabela je tabela kontigencije, a rezultati su u drugoj tabeli i to vrednost testa u redu Chi-Square, odakle se čita 2McN= 3,015, a vrednost p u redu Asymp. Sig, i ona iznosi p=0,082.
10.5. Aditivno dejstvo 2 testa Aditivno dejstvo 2 testa znači da je moguće sabrati veći broj vrednosti 2 testa (pri čemu se sabiraju i stepeni slobode) za istu pojavu i na osnovu tog zbira zaključiti o značajnosti razlike. Primer: Dejstvo vakcine protiv gripa ispitano je u Nišu, Kragujevcu, Beogradu i Novom Sadu i dobijene su sledeće vrednosti za 2 test: grad Niš Kragujevac Beograd Novi Sad Σ
136
vrednost 2 2,64 2,38 4,46 2,93 12,41
S.S. 1 1 1 1 4
Za svaki grad ponaosob rezultat je vezan za jedan stepen slobode i na nivou značajnosti je od p=0,05. Tablična vrednost 2 iznosi 3,841. Prema tome, statistički je značajan samo rezultat u Novom Sadu. Kako u ostalim Gradovima nemamo značajnost, to nemamo dovoljno dokaza ni za prihvatanje ni za odbacivanje nulte hipoteze. Međutim, kako zbir svih vrednosti 2 iznosi 12,41 i za 4 stepeni slobode, na nivou značajnosti od p=0,05 ovaj rezultat ukazuje na značajnost razlike, jer je: χ2 = 12,41 > χ2(4 i 0,05)= 9,49 i p12) da bi se dobila reprezentativna regresiona prava i pravi oblik međuzavisnosti među pojavama. Parametar a je regresiona konstanta i određuje „nivo“ regresione prave. To je vrednost y za x=0 i predstavlja tačku u kojoj regresiona linija seče y-osu. Drugim rečima, to je početna vrednost zavisne y kada još uvek nije počela da deluje nezavisna x. Osobine parametra a su: 1. ako je a =0, regresiona prava prolazi kroz koordinatni početak. To znači da ako obeležja ne mogu da imaju negativne vrednosti polaze od nultog „nivoa“, 2. ako je a>0, regresiona prava seče ordinatnu osu iznad koordinatnog početka, 3. ako je a1, regresiona prava se udaljava od X-ose i približava Y-osi, 3. ako je b0). Obrnuto, kada većim vrednostima nezavisno promenljive x, odgovaraju manje vrednosti zavisno promenljive y, odnosno opadanjem vrednosti nezavisne x rastu vrednosti zavisne y - onda je to negativna korelacija (r rxy(10; 0,05) =0,576 i p < 0,05 Kako je dobijena rxy vrednost od 0,94 veća od granične tablične vrednosti, rxy=0,576, za broj stepeni slobode 10 i prag značajnosti od p=0,05, to odbacujemo nultu i prihvatamo alternativnu hipotezu sa greškom p95% tvrdimo da postoji jaka pozitivna korelacija između broja eritrocita i količine hemoglobina 12 ispitanika. Za stepen slobode 10 i p=0,01 granična vrednost rxy=0,708. rxy = 0,94 > rxy(10; 0,01) =0,708 i p < 0,01 Kako je dobijena rxy vrednost od 0,94 veća od granične tablične vrednosti, rxy=0,708, za stepen slobode 10 i prag značajnosti od p=0,01, odbacujemo nultu i prihvatamo alternativnu hipotezu sa greškom p99% tvrdimo da postoji jaka pozitivna korelacija između broja eritrocita i količine hemoglobina 12 ispitanika. Postoji još jedan statistički problem. Naime, koeficijent proste linearne korelacije se obično izračunava iz uzorka. Postavlja se pitanje njegove signifikantnosti za celu populaciju, odnosno da li uzorak iz koga je izračunat koeficijent dovoljno reprezentativan za donošenje nepristrasne ocene koeficijenta osnovnog skupa. Dok se to ne utvrdi, dobijena vrednost koeficijenta na osnovu uzorka predstavlja samo hipotezu o vrednosti istog koeficijenta osnovnog skupa.
147
Problem je rešen na sledeći način: Testira se hipoteza da li je izračunati prost koeficijent linearne korelacije iz uzorka (rxy) i precizna ocena prostog koeficijenta linearne korelacije osnovnog skupa (Rxy). Ako odgovarajućim testom odbacimo nultu hipotezu, prihvatamo izračunatu vrednost koeficijenta korelacije iz uzorka kao pravu ocenu koeficijenta u osnovnom skupu. Drugim rečima uzorak je reprezentativan, pa dobijeni rezultat može da se uopšti. Testiranje koeficijenta proste linearne korelacije se zasniva na Studentovom rasporedu za n-2 stepena slobode, a dobijena t-vrednost se tumači na isti način kao i kod klasičnog Studentovog t-testa. Test je matematički definisan formulom:
t
rxy 1 rxy2
ili
t rxy
n2 1 rxy2
n2 gde je rxy - dobijena vrednost iz uzorka, a n - velicina uzorka (broj parova). Broj stepena slobode se izračunava po obrascu: S.S. = n-2. Dobijena t vrednost se tumači na isti način kao i kod klasičnog Studentovog t testa. Primer: Testirajmo dobijenu vrednost, rxy=0,94 za 12 osoba kod kojih je tražena veza izmedu broja eritrocita i vrednosti hemoglobina. Ho: Rxy (osnovnog skupa) = 0 Ha: Rxy (osnovnog skupa) 0
t
0,94 1 0,94 2 12 2
0,94 8,712 0,1078
t = 8,712 > t(10 i 0,05) = 2,23 i p t(10 i 0,01) = 3,17 i p
View more...
Comments