Poslovna_statistika[1]

January 15, 2017 | Author: Никола Николић | Category: N/A
Share Embed Donate


Short Description

Download Poslovna_statistika[1]...

Description

Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu. Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine. Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih radova u domaćim i međunarodnim stručnim publikacijama. Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakultetu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.

ISBN 86-7747-205-3

Prof. dr Dušan Joksimović • POSLOVNA STATISTIKA

Prof. dr Dušan Joksimović

POSLOVNA STATISTIKA

Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Prof. dr Dušan Joksimović

POSLOVNA STATISTIKA

Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Prof. dr Dušan Joksimović POSLOVNA STATISTIKA Recenzenti: Dr Nebojša Romčević, viši naučni saradnik Instituta za fiziku u Beogradu Dr Nenad Ignjatović, viši naučni saradnik Instituta tehničkih nauka SANU u Beogradu Izdaje i štampa: Megatrend univerzitet primenjenih nauka, Beograd, Makedonska 21 Za izdavača: Nevenka Trifunović, izvršni direktor Direktor izdavačke delatnosti: Dragan Karanović Lektor: Irina Milutinović Tehnički urednik: Prof. dr Dušan Joksimović Dizajn korica Branimir Trošić Tiraž: 1000 primeraka Copyright: © 2005 Megatrend univerzitet primenjenih nauka - Beograd Izdavač zadržava sva prava. Reprodukcija pojedinih delova ili celine ove publikacije nije dozvoljena! ISBN 86-7747-205-3

Odlukom Komisije za izdavačku delatnost Megatrend univerziteta primenjenih nauka broj 158/44 (23.1.2006) rukopis je odobren za štampu i upotrebu u nastavi kao udžbenik.

SADRŽAJ ............................................................................................................str. UVOD .................................................................................................................................7 1. DESKRIPTIVNA STATISTIČKA ANALIZA..........................................................10 1.1. Uređivanje i prikazivanje podataka .....................................................................10 1.2. Izračunavanje parametara raspodele obeležja ....................................................20 1.2.1. Parametri srednje vrednosti (mere srednje vrednosti) ................................20 1.2.2. Parametri varijabiliteta (mere disperzije) ......................................................32 1.2.3. Parametri oblika rasporeda (mere oblika rasporeda)...................................53 2. OSNOVNI POJMOVI TEORIJE VEROVATNOĆE ..............................................56 2.1. Algebra događaja. ...................................................................................................58 2.2. Verovatnoća ............................................................................................................61 2.2.1. Definicija verovatnoće ......................................................................................61 2.2.2. Osobine verovatnoće ........................................................................................64 2.2.3. Elementi kombinatorike ...................................................................................68 2.2.3.1. Varijacije od n elemenata k-te klase.........................................................69 2.2.3.2. Permutacije od n elemenata......................................................................71 2.2.3.3. Kombinacije od n elemenata k-te klase ...................................................73 3. RASPODELE SLUČAJNIH PROMENLJIVIH .......................................................77 3.1. Raspodele diskretnih slučajnih promenljivih .....................................................79 3.1.1. Parametri diskretnih slučajnih promenljivih ................................................85 3.1.1.1. Parametri centralne tendencije diskretne slučajne promenljive..................................................................................86 3.1.1.2. Parametri varijabiliteta diskretne slučajne promenljive..................................................................................90 3.1.1.3. Parametri oblika rasporeda diskretne slučajne promenljive..................................................................................93 3.1.2. Primeri nekih raspodela diskretnih slučajnih promenljivih ......................................................................................95 3.1.2.1. Binomna raspodela, B(n,p) .......................................................................95 3.1.2.2. Hipergeometrijska raspodela, H(N,N1,n)................................................97 3.1.2.3. Puasonova raspodela. P(λ) ................................................................... 100 3.2. Raspodele neprekidnih slučajnih promenljivih ...............................................104 3.2.1. Parametri neprekidnih slučajnih promenljivih ...........................................109 3.2.1.1. Parametri centralne tendencije neprekidne slučajne promenljive................................................................................109 3.2.1.2. Parametri varijabiliteta neprekidne slučajne promenljive.................................................................................111 3.2.1.3. Parametri oblika rasporeda neprekidne slučajne promenljive................................................................................................113

3.2.2. Primeri nekih raspodela neprekidnih slučajnih promenljivih ...................................................................................115 3.2.2.1. Normalna (Gausova) raspodela, N(μ,σ2)...............................................115 3.2.2.2. Studentova raspodela (t-raspodela), tv ..................................................121 3.2.2.3. Hi-kvadrat raspodela, χv2 ........................................................................124 3.3. Neke osobine matematičkog očekivanja E(X) i Varijanse Var(X) slučajne promenljive X .......................................................127 4. UZORAK I STATISTIKE UZORKA ......................................................................128 4.1. Prost slučajni uzorak ............................................................................................129 4.2. Raspodele parametara uzorka ............................................................................133 4.2.1. Raspodela aritmetičke sredine uzoraka X....................................................139 4.2.2. Raspodela razlike aritmetičkih sredina uzoraka, X1 — X2 ..........................146 4.2.3. Raspodela proporcije uzoraka Pr ..................................................................147 4.2.4. Raspodela varijanse uzoraka, S2 -μ poznato, S 2c -μ nepoznato .....................................................................150 5. STATISTIČKO OCENJIVANJE ..............................................................................152 5.1. Tačkaste ocene ......................................................................................................153 5.2. Intervalne ocene ...................................................................................................157 5.2.1. Intervalna ocena aritmetičke sredine populacije, μ ....................................158 5.2.2. Intervalna ocena razlike aritmetičkih sredina populacija, μ1 — μ2 ...........................................................................................164 5.2.3. Intervalna ocena proporcije populacije π ....................................................167 5.2.4. Intervalna ocena varijanse populacije, σ2 .....................................................170 6. TESTIRANJE PARAMETARSKIH STATISTIČKIH HIPOTEZA ...................................................................................174 6.1. Testiranje aritmetičke sredine populacije ,μ .....................................................181 6.2. Testiranje razlike aritmetičkih sredina populacije, μ1 — μ2 .............................194 6.3. Testiranje proporcije populacije, π .....................................................................199 6.4. Testiranje varijanse populacije σ2 .......................................................................203 7. REGRESIJA I KORELACIJA ...................................................................................210 7.1. Prosta linearna regresija i korelacija ..................................................................214 7.1.1. Ocenjivanje parametara α i β iz uzoračkih podataka .................................216 7.1.2. Standardna greška regresije, se.......................................................................218 7.1.3. Standardna greška ocene nagiba regresione krive, sb .................................219 7.1.4. Koeficijent determinacije, r2 ..........................................................................220 7.1.5. Koeficijent proste linearne korelacije u uzorku, r .......................................221 7.1.6. Standardna greška ocene koeficijenta proste linearne korelacije, sr ..........................................................................222

7.1.7. Korišćenje linearnog regresionog modela za predviđanje vrednosti zavisnog obeležja ...............................................223 7.1.8. Interval predviđanja prosečne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp .............................224 7.1.9. Interval predviđanja individualne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp.................225 7.2. Kvadratna regresija i korelacija...........................................................................227 7.2.1. Standardna greška kvadratne regresije, se ....................................................230 7.2.2. Koeficijent determinacije kvadratne regresije, r2 ........................................230 7.3. Logaritamska regresija i korelacija .....................................................................231 7.4. Eksponencijalna regresija i korelacija ................................................................232 8. INDEKSI.....................................................................................................................240 8.1. Individualni indeksi .............................................................................................241 8.1.1. Individualni bazni indeksi, Bi ........................................................................241 8.1.2. Individualni lančani indeksi, Li .....................................................................243 8.1.3. Srednji tempo porasta, S.................................................................................244 8.1.4. Srednji tempo pada, P.....................................................................................246 8.2. Grupni agregatni indeksi.....................................................................................247 8.2.1. Metod prosečnih odnosa (srednje vrednosti) .............................................247 8.2.2. Metod agegata ..................................................................................................249 8.2.2.1. Neponderisani metod agregata ..............................................................250 8.2.2.2. Ponderisani metod agregata ...................................................................252 8.2.2.2.1. Lespeyers-ov metod ......................................................................252 8.2.2.2.2. Pasche-ov metod ...........................................................................254 8.2.2.2.3. Fisher-ov metod (idealni metod) ................................................255 8.2.2.2.4. Marshal-Edgworth-ov metod .....................................................257 9. ANALIZA VREMENSKIH SERIJA ........................................................................260 9.1. Dekompozicija vremenskih serija ......................................................................261 9.1.1. Metod pokretnih proseka (pokretnih sredina), PP ....................................263 9.1.2. Određivanje trenda, T(i) ................................................................................268 9.1.3. Određivanje ciklične komponente, C(i) .......................................................271 9.1.4. Određivanje sezonske komponente, S(i) ......................................................273 9.1.5. Određivanje rezidualne komponente, R(i) ..................................................276 9.1.6. Određivanje desezonirane serije DX (i) .......................................................278 9.2. Prognoza vremenske serije..................................................................................281 9.2.1. Eksponencijalno poravnanje .........................................................................281 LITERATURA ...............................................................................................................288 TABELE ..........................................................................................................................291

Poslovna statistika

UVOD - Kratak istorijat statistiþke analize. Poþeci statistiþke analize datiraju nekoliko vekova pre naše ere. Prva poznata prebrojavanja sprovedena su u Kini oko 4000 godina pre nove ere i u Egiptu oko 3000 godina pre nove ere, dok su prvi organizovani popisi vršeni u starom veku u Rimskoj republici. U srednjem veku vršeni su uglavnom popisi zemljišta i stoke i u nekim evropskim zemljama registri roÿenih, umrlih i venþanih lica. Prvi sistematski organizovani popisi stanovništva vršeni su krajem XVIII veka. Sama reþ „statistika” prvi put je upotrebljena u prvoj polovini XVIII veka u radovima Gotfrida Aþenvala (Gottfried Achenwal), profesora univerziteta u Getingenu. Poþeci statistike kao nauþne discipline skoro istovremeno datiraju od XVII veka u Nemaþkoj i Engleskoj. Poþetkom XIX veka dolazi do naglog razvoja statistiþkih teorija, najviše zahvaljujuüi razvoju teorije verovatnoüe i složenijih matematiþkih analiza. Naravno, vrtoglavi razvoj sistema elektronskih raþunara u drugoj polovini XX veka, inicirao je ogroman skok u aspektu primene statistiþkih metoda u, sada veü, gotovo svim analizama bilo kojih masovnih pojava. U današnje vreme statistika predstavlja simbiozu sledeüih komponenti: -

-

deskriptivna statistika koja se bavi prikupljanjem, obradom i prezentiranjem veü postojeüih podataka; statistiþka analiza koja predstavlja skup statistiþkih metoda pomoüu kojih se vrši kvantitativna analiza meÿusobnih odnosa izmeÿu pojava koje imaju masovni karakter i pomoüu kojih se donose odreÿeni zakljuþci i definišu zakonitosti ponašanja posmatranih pojava; statistiþka teorija koja pronalazi nove statistiþke metode i usavršava veü postojeüe.

- Predmet statistiþkog istraživanja. Statistika istražuje pojave koje su po svojoj prirodi varijabilne, koje imaju masovni karakter i þije ponašanje u masi, na našem nivou intelektualnog razvoja, nije unapred odreÿeno egzaktnim uzroþno-poslediþnim zakonitostima. Posmatranjem i analiziranjem pojava na velikom broju sluþajeva, statistika donosi odreÿene zakljuþke o masovnom ponašanju tih pojava, te se najþešüe i predstavlja kao nauþni metod kvantitativnog istraživanja masovnih pojava.

7

Poslovna statistika - Statistiþki skup (populacija, osnovni skup). Skup svih elemenata na kojima se odreÿena pojava statistiþki posmatra zove se statistiþki skup (populacija, osnovni skup). Pojedinaþni elementi iz kojih se statistiþki skup sastoji zovu se elementi statistiþkog skupa (statistiþke jedinice). Definisanje statistiþkog skupa u svakom konkretnom sluþaju zavisi od prirode pojave koja se želi statistiþki analizirati, od cilja istraživanja i od raspoloživih moguünosti posmatranja, ali se uvek mora voditi raþuna o tome da statistiþki skup bude relativno homogen, odnosno da elementi statistiþkog skupa imaju bar jednu zajedniþku osobinu. Što elementi skupa imaju više zajedniþkih osobina, to je statistiþki skup homogeniji. Takoÿe, prilikom definisanja statistiþkog skupa, mora se voditi raþuna o tome da elementi skupa budu istovrsni, ali, naravno, ne i istovetni. U ovom odžbeniku üemo broj þlanova populacije (broj elemenata statistiþkog skupa) obeležavati sa N.

- Uzorak. Uglavnom je nemoguüe, a mahom uvek ekonomski i prostornovremenski neopravdano, vršiti statistiþku analizu na þitavom statistiþkom skupu. Zbog toga se vrlo þesto iz þitavog statistiþkog skupa vrši odabir nekih elemenata skupa (vrši se uzorkovanje skupa) na kojima se sprovodi dalja statistiþka analiza, koja rezultira odreÿenim kvantitativnim zakljuþcima koji važe za þitav statistiþki skup. Naþini na koji se vrši uzorkovanje skupa nisu proizvoljni, veü moraju ispuniti odreÿene zahteve, koji üe biti analizirani u ovom udžbeniku. Podskup statistiþkog skupa dobijen uzorkovanjem njegovih elemenata zove se uzorak. Broj þlanova uzorka (broj elemata uzorka) u ovom udžbeniku üemo obeležavati sa n. - Obeležje. Osobine po kojima se jedinice statistiþkog skupa ili uzorka razlikuju, a koje su predmet statistiþke analize, zovu se obeležja i obiþno se dele na atributna (opisna) i numeriþka. - Atributna obeležja su obeležja koja se izražavaju opisno (zanimanje, boja kose, pol, itd.). - Numeriþka obeležja su obeležja koja se izražavaju brojþano i mogu biti prekidna (diskretna) i neprekidna (kontinualna). - Prekidna numeriþka obeležja su ona obeležja koja mogu imati samo izolovane vrednosti (broj prodatih automobila, broj roÿenih, broj þlanova porodice, itd.). 8

Poslovna statistika - Neprekidna numeriþka obeležja su ona obeležja koja mogu imati bilo koju vrednost unutar nekog intervala (visina, težina, potrošnja goriva, itd.). U ovom udžbeniku üemo objasniti neke od statistiþkih metoda koje se koriste u analizi numeriþkih obeležja, dok se analizom atributnih obeležja neüemo baviti.

Generalno, statistiþki metodi analize masovnih pojava se mogu svrstati u dve grupe: deskriptivna statistiþka analiza i analitiþka statistika.

- Deskriptivna statistiþka analiza obuhvata metode prikupljanja, sreÿivanja i prikazivanja podataka iz statistiþkog skupa ili iz uzorka, i metode odreÿivanja odreÿenih parametara statistiþkog skupa ili uzorka, naravno onih parametara koji su relevantni za opis ponašanja posmatranog obeležja u posmatranom skupu.

- Analitiþka statistika se bavi objašnjavanjem i procenjivanjem varijabiliteta, statistiþkim zakljuþivanjima na onovu uzorka i predviÿanjima ponašanja posmatranog obeležja u buduünosti. Takoÿe, metodi statistiþke analize mogu se podeliti na statiþke i dinamiþke. - Metodi statiþke statistiþke analize analiziraju promene obeležja unutar osnovnog skupa (populacije) u okviru jednog trenutka (ili intervala vremena). - Metodi dinamiþke statistiþke analize analiziraju vremensku zavisnost obeležja.

9

Poslovna statistika

1. DESKRIPTIVNA STATISTIýKA ANALIZA

1.1. Ureÿivanje i prikazivanje podataka Dobijeni podaci o vrednostima obeležja koje imaju ispitivani elementi populacije (ili uzorka) predstavljaju niz neureÿenih numeriþkih podataka. Postupak njihovog ureÿivanja predstavlja njihovo predstavljanje po veliþini od najmanje do najveüe vrednosti. Tako ureÿen niz vrednosti posmatranog obeležja predstavlja ureÿenu statistiþku seriju, þiji üemo i-ti þlan obeležavati sa xi , i obiþno ih nazivamo negrupisanim podacima. Prikazivanje ureÿenih podataka može biti tabelarno (u vidu tabela) i grafiþko (u vidu grafikona). Da bi se ureÿeni podaci prikazali tabelarno ili grafiþki, neophodno je prvo ih grupisati, odnosno odrediti klase po kojima üe se rasporeÿivati elementi populacije (ili uzorka). U zavisnosti od osobina obeležja koje se ispituje, klase mogu biti diskretne (ispitivana obeležja su diskretna) ili intervalne (ispitivana obeležja su neprekidna). Diskretna klasa, kod diskretnih obeležja, odreÿuje onu grupu þlanova populacije koja ima istu vrednost obeležja, dok intervalna klasa, kod neprekidnih obeležja, odreÿuje onu grupu þlanova populacije koja ima vrednosti unutar istog, unapred odreÿenog intervala vrednosti obeležja. Klasni intervali intervalnih klasa obiþno su iste širine (u analizama koje üe biti sprovedene u ovom udžbeniku, klasni intervali moraju biti iste širine). Donja i gornja granica klasnog intervala moraju biti jasno i nedvosmisleno odreÿene i moraju oþuvati kontinualnu prirodu vrednosti posmatranog obeležja, odnosno moraju biti u vidu poluotvorenih intervala koji se ne preklapaju (þiji je presek prazan skup), i koji prekrivaju þitavu oblast moguüih posmatranih vrednosti obeležja (þija je unija þitav interval moguüih vrednosti obeležja). Dakle, kod diskretnih obeležja, klase su odreÿene vrednostima obeležja koje se pojavljuju u ureÿenoj seriji, dok kod neprekidnih obeležja, klase (njihov broj, odnosno klasni interval) odreÿuje osoba koja vrši statistiþku analizu. 10

Poslovna statistika Broj klasa nadalje üemo obeležavati sa K. Ne postoji jasno definisano pravilo po kome bi se trebalo rukovoditi prilikom odreÿivanja broja intervalnih klasa, veü odreÿeni broj preporuka. Neke od njih su:

a)

po Sturgesovoj formuli K | 1  3.3 log N

b) N  >40,60 Ÿ K  >6,8 N  >60,100 Ÿ K  >7,10 N  >100,200 Ÿ K  >9,12 N  >200,500 Ÿ K  >12,17 N ² 500 Ÿ K 21

c) za bilo koje N važi K  >5,15@ . Predstavnik i-te klase (obeležavaüemo ga sa xi, ) kod diskretnih klasa predstavlja vrednost obeležja koje odreÿuje i-tu klasu, dok kod neprekidnih klasa predstavlja sredinu i-tog klasnog intervala. Širina i-tog klasnog intervala (obeležavaüemo je sa 'i) predstavlja razliku izmeÿu poþetka (i+1)-og i poþetka i-tog klasnog intervala. U analizama koje üe biti sprovedene u ovom udžbeniku, intervalne klase moraju biti izabrane tako da su im širine meÿusobno iste, pa üemo širinu klasnog intervala obeležavati sa '.

Tabelarno, odnosno grafiþko prikazivanje ureÿenih podataka, u stvari, predstavlja prikazivanje odreÿenog broja pojavljivanja vrednosti datog obeležja u ispitivanoj populaciji (uzorku), to jest prikazivanje sledeüih frekvencija:

11

Poslovna statistika -

Apsolutna frekvencija i-te klase – obeležiüemo je sa fi – koja predstavlja ukupan broj þlanova populacije (uzorka) koji imaju vrednost obeležja odreÿenu i-tom klasom (i = 1, 2, ..., K). K

Oþigledno je da važi

¦f

i

N.

i 1

-

Relativna frekvencija i-te klase – obeležiüemo je sa pi, – koja predstavlja relativan broj þlanova populacije (uzorka) koji imaju vrednost obeležja odreÿenu i-tom klasom ( i = 1,2,...,K ), to jest fi pi . N K

Oþigledno je da važi

¦p

i

1.

i 1

-

Kumulativna frekvencija i-te klase – obeležiüemo je sa Ki – odreÿena sa „d” ukoliko se radi o diskretnim klasama ili intervalnim klasama þija je gornja granica zatvorena, ili sa „” ukoliko se radi o intervalnim klasama þija je gornja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj þlanova populacije (uzorka) koji imaju vrednost obeležja manju ili jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti gornje granice i-te intervalne klase þija je gornja granica zatvorena, odnosno predstavlja ukupan broj þlanova populacije (uzorka) koji imaju vrednost obeležja manju od vrednosti gornje granice i-te intervalne klase þija je gornja granica otvorena (i = 1, 2, ..., K).

Oþigledno je da važi K K

-

N.

Kumulativna frekvencija i-te klase – obeležiüemo je sa Wi – odreÿena sa „t” ukoliko se radi o diskretnim klasama ili intervalnim klasama þija je donja granica zatvorena, ili sa „!” ukoliko se radi o intervalnim klasama þija je donja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj þlanova populacije (uzorka) koji imaju vrednost obeležja veüu ili jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti donje granice i-te intervalne klase þija je donja granica zatvorena, odnosno predstavlja ukupan broj þlanova populacije (uzorka) koji imaju vrednost

12

Poslovna statistika obeležja veüu od vrednosti donje granice i-te intervalne klase þija je donja granica otvorena (i = 1, 2, ..., K). Oþigledno je da važi W1

N.

Naravno, sve gore navedeno važi i za uzorak, uz þinjenicu da je tada N=n. Grafiþki prikaz frekvencija daje se u vidu grafikona u pravouglom Dekartovom koordinatnom sistemu (x, y), gde se na x-osu nanose vrednosti obeležja i-te klase, a na y-osu vrednost frekvencije koja se predstavlja (recimo fi). Kod diskretnih obeležja (diskretnih klasa) taj grafiþki prikaz je u vidu izlomljenih pravih linija koje spajaju taþke ( xi, , fi) (ukoliko predstavljamo apsolutnu frekvenciju fi) i naziva se poligon. Kod neprekidnih obeležja (intervalnih klasa) taj grafiþki prikaz je u vidu pravougaonika þija je širina jednaka širini klasnog intervala, a visina nad i-tim klasnim intervalom jednaka vrednosti i-te frekvencije koja se predstavlja (recimo fi).

Primer 1.1.1. Anketirana je populacija od 50 studenata o broju položenih ispita i telesnoj težini. Dobijeni su sledeüi rezultati:

a) broj položenih ispita:

7 11 9 10 4

4 6 8 11 12

12 7 6 11 6

3 8 8 12 7

7 6 7 6 8

8 9 6 7 9

13

6 4 8 7

5 5 9 8

9 5 6 4

9 7 7 10

10 3 4 11

Poslovna statistika b) težina (u kg):

57 71 89 104 64

84 68 78 110 62

112 72 67 91 65

83 78 68 92 73

77 76 74 68 81

68 89 69 75 91

96 74 80 77

105 55 79 82

90 85 66 64

69 87 67 101

102 73 64 91

Prikazati tabelarno i grafiþki apsolutnu frekvenciju, relativnu frekvenciju, kumulativne frekvencije odreÿene sa „manje do jednako od” i „veüe do jednako od”, za oba obeležja.

Rešenje:

a) Tabelarni prikaz dat je u Tabeli 1.1.1.a. Broj položenih ispita 3 4 5 6 7 8 9 10 11 12

Apsolutna frekvencija fi 2 5 3 8 9 7 6 3 4 3 ¦ fi=50

Relativna frekvencija pi 2/50 5/50 3/50 8/50 9/50 7/50 6/50 3/50 4/50 3/50 ¦ pi=1

Kumulativna frekvencija d Ki 2 7 10 18 27 34 40 43 47 50

Tabela 1.1.1.a.

14

Kumulativna frekvencija t Wi 50 48 43 40 32 23 16 10 7 3

Poslovna statistika

Apsolutna frekvencija

Grafiþki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na sledeüim slikama.

10 9 8 7 6 5 4 3 2 1 0 0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15

Broj položenih ispita

Relativna frekvencija

Slika 1.1.1.a. Grafiþki prikaz apsolutne frekvencije

0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15

Broj položenih ispita

Slika 1.1.1.b. Grafiþki prikaz relativne frekvencije

15

Kumulativna frekvencija =

1.1.1.c. Grafiþki prikaz kumulativne frekvencije (d)

50 45 40 35 30 25 20 15 10 5 0 0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15

Broj položenih ispita

1.1.1.d. Grafiþki prikaz kumulativne frekvencije (t)

16

Poslovna statistika b) Imajuüi u vidu preporuke date u ovom udžbeniku o grupisanju neprekidnih vrednosti obeležja u intervalne klase i þinjenicu da je najmanja težina u populaciji 55 kg, a najveüa 112 kg, podatke o težini iz ove populacije üemo grupisati u sedam klasa širine 10 kg, poþev od 50 kg.

Tabelarni prikaz je dat u Tabeli 1.1.1.b.

Interval težine (kg)

>50 -60 >60 -70 >70 -80 >80 -90 >90 -100 >100 -110 >110 -120

Apsolutna frekvencija fi 2 14 13 9 6 4 2 ¦ fi=50

Relativna frekvencija pi 2/50 14/50 13/50 9/50 6/50 4/50 2/50 ¦ pi=1

Kumulativna frekvencija < Ki 2 16 29 38 44 48 50

Kumulativna frekvencija t Wi 50 48 34 21 12 6 2

Tabela 1.1.1.b.

Grafiþki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na sledeüim slikama.

17

Poslovna statistika

Apsolutna frekvencija

14 12 10 8 6 4 2 0

50

60

70

80

90

100

110

120

(kg)

Težina Slika 1.1.1.e. Grafiþki prikaz apsolutne frekvencije

0.28

Relativna frekvencija

0.24 0.2 0.16 0.12 0.08 0.04 0

50

60

70

80

90

100

110 120

Težina

Slika 1.1.1.f. Grafiþki prikaz relativne frekvencije

18

(kg)

Poslovna statistika

50 Kumulativna frekvencija <

45 40 35 30 25 20 15 10 5 0

50

60

70

80

90

100

110

120

(kg)

Težina

Slika 1.1.1.g. Grafiþki prikaz kumulativne frekvencije (=

45 40 35 30 25 20 15 10 5 0

50

60

70

80

90

100

110

120

(kg)

Težina

Slika 1.1.1.h. Grafiþki prikaz kumulativne frekvencije (t)

19

Poslovna statistika 1.2.

Izraþunavanje parametara raspodele obeležja

Ureÿivanje i prikazivanje podataka analizirano u prethodnom odeljku 1.1, samo je priprema podataka za njihovu dalju obradu. Naime, da bi se izveli odreÿeni zakljuþci o raspodeli ispitivanog obeležja u populaciji, ili u uzorku, pa kasnije na osnovu toga i u celoj populaciji, neophodno je izraþunati neke veliþine (parametre, pokazatelje, mere) koji na neki naþin prezentuju ponašanje raspodeljenosti obeležja u posmatranoj populaciji. Uopšteno, ti parametri se mogu podeliti u tri osnovne grupe: - parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije); - parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda). Neki od parametara koje üemo izraþunavati isto üe se oznaþavati i za populaciju i za uzorak, dok üe neki imati razliþite oznake u zavisnosti od toga da li se radi o populaciji ili uzorku. Takoÿe, neke od formula po kojima üe se raþunati parametri, biüe identiþne i za populaciju i za uzorak, dok üe se neke razlikovati. U ovom trenutku þitalac treba da obrati pažnju na te razlike i da ih prihvati bez dodatnih objašnjenja, uz napomenu da üe se u kasnijim delovima udžbenika adekvatno razjasniti potreba za ovim razlikama.

1.2.1.

Parametri srednje vrednosti (mere srednje vrednosti)

Parametre srednje vrednosti možemo podeliti na izraþunate i pozicione. Izraþunati su: - aritmetiþka sredina, - geometrijska sredina, - harmonijska sredina.

Pozicioni su: 20

Poslovna statistika

- modus, - medijana. Zavisnost prirode promene ispitivanog obeležja nam diktira koji üemo od gore pomenuta tri izraþunata parametra srednje vrednosti da koristimo kao relevantnu meru srednje vrednosti datog obeležja u posmatranoj populaciji (uzorku). Kada je priroda promene posmatranog obeležja linearno zavisna, koristiüemo aritmetiþku sredinu kao meru srednje vrednosti. Linearna zavisnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka aritmetiþkom zbiru obeležja svakog þlana grupe ponaosob (visina, težina, broj prodatih automobila, broj poena na ispitu...). Ovakva priroda promene je najzastupljenija u svakodnevnom životu. Kada je priroda promene posmatranog obeležja direktno proporcionalna, koristiüemo geometrijsku sredinu kao meru srednje vrednosti. Direktna proporcionalnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka proizvodu obeležja svakog þlana grupe ponaosob (procenat...). Kada je priroda promene posmatranog obeležja obrnuto proporcionalna, koristiüemo harmonijsku sredinu kao meru srednje vrednosti. Obrnuta proporcionalnost promene ogleda se u tome da se grupna vrednost obeležja smanjuje kada se poveüava broj þlanova grupe i obrnuto (vreme završetka nekog posla u odnosu na broj ljudi koji ga istovremeno rade i sl.).

- Aritmetiþka sredina. Aritmetiþku sredinu bilo kojih N brojeva x1, x2, ..., xN ___

obeležavamo sa X i izraþunavamo po formuli: ___

X

x1  x 2  ...  x N . N

Od sada pa nadalje u ovom udžbeniku, aritmetiþku sredinu populacije üemo ___

obeležavati sa P, dok üemo aritmetiþku sredinu uzorka obeležavati sa X . Kada podatke nismo grupisali u klase važi:

21

Poslovna statistika N

P

¦x

n

i

i 1

___

X

N

¦x

i

i 1

.

n

Kada smo podatke grupisali u klase važi: K

P

¦

K

f i ˜ xi,

i 1

N

___

X

¦f

i

i 1

n

˜ xi, .

Imajuüi u vidu da je predstavnik diskretne klase xi, jednak vrednosti obeležja koje imaju svi þlanovi te klase (u i-toj klasi fi þlanova ima vrednost xi koja je jednaka xi, ), zakljuþujemo da je aritmetiþka sredina u istoj seriji podataka diskretnih obeležja identiþna bez obzira na to da li su podaci grupisani ili ne, dok za neprekidna obeležja to ne možemo da tvrdimo jer je kod grupisanih neprekidnih obeležja predstavnik i-te klase xi, , sredina i-tog klasnog intervala, a sama raspodela obeležja u i-toj klasi ne mora biti takva da je njihova aritmetiþka sredina baš sredina tog klasnog intervala.

Primer 1.2.1.1. Za podatke iz Primera 1.1.1. izraþunati aritmetiþku sredinu broja položenih ispita i težine anketiranih studenata a) negrupišuüi podatke, b) grupišuüi podatke. Rešenje:

i) Ako ne grupišemo podatke, za aritmetiþku sredinu broja položenih ispita dobijamo: 50

P

¦x

i

i 1

7.44 50 a za aritmetiþku sredinu težine studenata dobijamo:

22

Poslovna statistika 50

P

¦x

i

i 1

79.26 kg.

50

ii) Ako grupišemo podatke, za aritmetiþku sredinu broja položenih ispita dobijamo: 10

P

¦f

i

˜ xi,

i 1

N 2 ˜ 3  5 ˜ 4  3 ˜ 5  8 ˜ 6  9 ˜ 7  7 ˜ 8  6 ˜ 9  3 ˜ 10  4 ˜ 11  3 ˜ 12 7.44 50 naravno, istu vrednost kao i kada nismo grupisali podatke, jer je obeležje diskretnog tipa.

Ako grupišemo podatke, za aritmetiþku sredinu težine studenata dobijamo: 7

P

¦f

i

˜ xi,

i 1

N 2 ˜ 55  14 ˜ 65  13 ˜ 75  9 ˜ 85  6 ˜ 95  4 ˜ 105  2 ˜ 115 79.6 kg. 50 Kao što smo i oþekivali, aritmetiþka sredina grupisanih podataka se razlikuje od aritmetiþke sredine negrupisanih jer je težina obeležje neprekidnog tipa.

Aritmetiþka sredina se ponekad naziva i moment prvog reda. Generalno, moment reda k oznaþavamo sa mk i izraþunavamo po formuli: N

¦x mk

i 1

N

k i

za negrupisane podatke,

23

Poslovna statistika k

K

¦

f i ˜ xi,

i 1

mk

za grupisane podatke.

N

- Aritmetiþka sredina aritmetiþkih sredina. Neka je dato m razliþitih populacija (ili uzorka), i neka je broj þlanova svake od ovih populacija (uzorka) Ni (odnosno ni), i neka je aritmetiþka sredina svake od ovih populacija (uzorka) ___

Pi (odnosno X i ), tada je, ako sve ove populacije (uzorke) spojimo u jednu, aritmetiþka sredina novodobijene populacije (uzorka) jednaka: m

__

P

m

¦ N i ˜ Pi

___

i 1

X

m

¦N

___

¦ ni ˜ X i i 1

¦n

i

i 1

.

m

i

i 1

Primer 1.2.1.2. Proseþna visina svih 220 devojaka na prvoj godini studija je 168 cm, a proseþna visina svih180 muškaraca na prvoj godini je 182 cm. Kolika je proseþna visina studenta prve godine? Rešenje:

Proseþna visina studenta na prvoj godini studija je m

_

P

¦N

i

˜ Pi

i 1

m

¦N

220 ˜ 168  180 ˜ 182 220  180

174.3 cm.

i

i 1

- Geometrijska sredina. Geometrijsku sredinu bilo kojih N brojeva x1, x2, ..., xN obeležavamo sa G i izraþunavamo po formuli:

G

N

x1 ˜ x 2 ˜ ... ˜ x N .

24

Poslovna statistika Kada želimo da iskažemo geometrijsku sredinu kao meru srednje vrednosti odreÿenog obeležja u populaciji (ili uzorku), onda važi: za negrupisane podatke

G

N

x1 ˜ x 2 ˜ ... ˜ x N ,

za grupisane podatke

G

K

x1, 1 ˜ x 2, 2 ˜ ... ˜ x K,

f

f

fK

,

gde je: G - reprezent geometrijske sredine koji pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja; xi - reprezent vrednosti obeležja koje pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., N);

xi, - reprezent predstavnika i-te klase koji pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., K). Formule za geometrijsku sredinu uzorka su identiþne uz uslov N=n. Primer 1.2.1.3. U poslednje þetiri godine cena neke robe se menjala na sledeüi naþin: prve godine poveüala se za 10%, druge se poveüala za 12%, treüe godine se smanjila za 5% i þetvrte godine se smanjila za 17%. Kakva je proseþna procentualna godišnja promena cene ove robe u ovom periodu? Rešenje:

Ukoliko sa p predstavimo decimalni zapis procentualne promene od p%, p% , onda je odnosno p 100 (1+ p) pravilni reprezent porasta od p%, a (1 - p) pravilni reprezent smanjenja od p%, pa je reprezent geometrijske sredine procentualne godišnje promene cena u ovom periodu G

4

1,1 ˜ 1,12 ˜ 0,95 ˜ 0,83

0,99278 .

25

Poslovna statistika Zakljuþujemo da se u ovom þetvorogodišnjem periodu ovakvim promenama cena robe proseþno godišnje smanjivala 0,722%.

- Harmonijska sredina. Harmonijsku sredinu bilo kojih N brojeva x1, x2, ..., xN obeležavamo sa H i izraþunavamo po formuli: H

N 1 1 1   ...  x1 x 2 xN

.

Kada želimo da iskažemo harmonijsku sredinu kao meru srednje vrednosti odreÿenog obeležja u populaciji (ili uzorku), onda važi: za negrupisane podatke:

H

N N

1

¦x i 1

za grupisane podatke:

H

i

N K

fi ¦ , i 1 xi

.

Formule za harmonijsku sredinu uzorka su identiþne uz uslov N=n. Primer 1.2.1.4. Osoba A uradi jedan posao radeüi sam za 10 þasova. Osoba B za 12 þasova, a osoba C za 9 þasova. Ako su osobe A, B i C iz iste grupacije ljudi, koliko je srednje vreme potrebno da jedan þovek iz te grupacije sam uradi taj posao?

Rešenje:

Pošto je vreme za koje bi se završio taj posao obrnuto proporcionalno broju ljudi iz te grupacije koji bi ga istovremeno obavljali (što više ljudi istovremeno radi na tom poslu, to üe vreme izrade posla biti manje), to je srednje vreme potrebno da jedan þovek iz te grupacije sam uradi taj posao jednako:

26

Poslovna statistika 3 þasova=10,19 þasova. 1 1 1   10 12 9

H

Izmeÿu harmonijske, geometrijske i harmonijske sredine izraþunate nad istim skupom brojeva, važi sledeüa nejednaþina: ____

H dGd X .

- Modus. Za negrupisane podatke modus (M0) je vrednost obeležja koje se najþešüe javlja u seriji.

Za grupisane podatke diskretnog tipa, modus (M0) je takoÿe vrednost obeležja koje se najþešüe javlja u seriji, što u ovom sluþaju predstavlja vrednost klase þija je apsolutna frekvencija najveüa. Za grupisane podatke neprekidnog tipa modus (M0) nalazimo tako što prvo pronaÿemo modalnu klasu, kao klasu þija je apsolutna frekvencija najveüa. Zatim modus izraþunavamo po formuli: M0

LM 0 

f M 0  f M 0 1 f M 0  f M 0 1  f M 0  f M 0 1

˜' ,

gde je: LM 0 - poþetak modalne klase, f M 0 - apsolutna frekvencija modalne klase, f M 0 1 - apsolutna frekvencija klase pre modalne, f M 0 1 - apsolutna frekvencija klase posle modalne,

' - širina klasnog intervala. Vrednost modusa neprekidnih podataka grupisanih u klase može se dobiti i grafiþkim putem kao apscisa taþke preseka prave koja je odreÿena taþkama LM 0 , f M 0 1 i LM 0  ', f M 0 i prave odreÿene taþkama LM 0 , f M 0 i

L

M0

(Slika 1.2.1).  ', f



M 0 1

27



Poslovna statistika

fi fMo fMo+1 fMo-1

LMo Mo LMo+'

xi

Slika 1.2.1.

Interesantno je napomenuti da ako bi se konstruisala parabola koja prolazi kroz tri sredine gornjih strana pravougaonika, apscisa maksimuma te parabole bi se poklopila sa modusom. Ukoliko se svaki podatak u seriji pojavljuje isti broj puta, odnosno ukoliko su sve apsolutne frekvencije meÿusobno jednake, onda modus ne postoji. Ukoliko postoji samo jedan modus, kažemo da je serija, odnosno raspodela unimodalna. Ukoliko postoje dva modusa, onda kažemo da je serija, odnosno raspodela bimodalna, a ako postoji više od dva modusa, onda seriju, odnosno raspodelu proglašavamo polimodalnom.

Primer 1.2.1.5. Za podatke iz Primera 1.1.1. izraþunati modus:

a) broja položenih ispita, b) težine anketiranih studenata.

28

Poslovna statistika Rešenje: a) Kako je najfrekventnija klasa klasa u kojoj se nalaze þlanovi populacije koji imaju sedam položenih ispita, to je modus ove unimodalne raspodele Mo=7.

b) Najfrekventnija klasa, odnosno modalna klasa, je klasa >60 -700 kg, pa je modus Mo

LM o 

f M o  f M o 1 f M o  f M o 1  f M o  f M o 1

˜'

60 

14  2 ˜ 10 | 69,23kg. 14  2  14  13

- Medijana. Za negrupisane podatke medijana (Me) je vrednost obeležja koje se nalazi u sredini ureÿene statistiþke serije. Dakle, broj þlanova populacije (uzorka) koji su manji od Me te populacije (tog uzorka) jednak je broju þlanova te populacije (tog uzorka) koji su veüi od Me te populacije (tog uzorka).

Ukoliko je broj þlanova ureÿene statistiþke serije neparan, N 2 ˜ k  1 , tada je ª N  1º medijana jednaka vrednosti « » -og þlana te serije, a ukoliko je broj ¬ 2 ¼ þlanova ureÿene statistiþke serije paran, N 2 ˜ k , tada je medijana jednaka ªN º ªN º aritmetiþkoj sredini « » -og i «  1» -og þlana te serije. ¼ ¬2¼ ¬2 Odnosno, za negrupisane podatke važi: N

2˜ k 1

Ÿ

Me

x ª N 1 º « 2 » ¬ ¼

xª N º  xª N N

2˜k

Ÿ

Me

º « 2 1» ¬ ¼

«2» ¬ ¼

2

29

.

Poslovna statistika Za grupisane podatke diskretnog tipa, Me takoÿe predstavlja vrednost obeležja koje se nalazi u sredini ureÿene statistiþke serije. Izraþunavanje vrednosti Me je ª N  1º u ovom sluþaju isto kao i za negrupisane podatke, samo se vrednosti « »¬ 2 ¼ ªN º ªN º og þlana (ukoliko je N 2 ˜ k  1 ), odnosno « » -og i «  1» -og þlana ¼ ¬2¼ ¬2 (ukoliko je N 2 ˜ k ), nalaze iz tabelarne predstave ureÿene serije.

Za grupisane podatke neprekidnog tipa, Me je vrednost koja deli histogram na dva dela jednakih površina. Naravno da i tada važi da je broj þlanova populacije (uzorka) koji su manji od tako odreÿene Me jednak broju þlanova te populacije (tog uzorka) koji su veüi od Me . Da bismo odredili Me za grupisane podatke neprekidnog tipa, potrebno je prvo da pronaÿemo medijalnu klasu Me,kl. Medijalnu klasu Me,kl. odreÿujemo iz uslova: M e , kl 1

¦

M

fi d

i 1

N e , kl ¢ ¦ fi . 2 i1

Medijanu Me odreÿujemo iz jednaþine M

Me

LM e , kl

1

e , kl N  ¦ fi 2 i 1  ˜' , f M e , kl

gde je: LM e , kl - poþetak medijalne klase, f M 0 , kl - apsolutna frekvencija medijalne klase,

N - broj þlanova populacije, f i - apsolutna frekvencija i-te klase, ' - širina klasnog intervala. Formule za medijanu Me uzorka su identiþne uz uslov N=n.

30

Poslovna statistika Primer 1.2.1.6. Za podatke iz Primera 1.1.1. izraþunati medijanu:

a) broja položenih ispita, b) težine anketiranih studenata.

Rešenje:

a) Populacija sadrži paran broj þlanova, N=50, pa medijanu nalazimo kao aritmetiþku sredinu 25. i 26. þlana serije ureÿene u rastuüi poredak. Analizirajuüi kumulativnu frekvenciju Ki , vidimo da se i 25. i 26. þlan serije ureÿene u rastuüi poredak nalaze u klasi u kojoj se nalaze þlanovi populacije koji su položili sedam ispitai, pa je medijana ove raspodele Me

X 25  X 26 2

77 2

7.

b) Kako je

N 2

50 2

25 , to je medijalna klasa >70 -80 kg, pa je medijana M

Me

LM e , kl

1

e , kl N  ¦ fi 2 i 1  ˜' f M e , kl

70 

25  16 ˜ 10 | 76,92 kg. 13

31

Poslovna statistika 1.2.2. Parametri varijabiliteta (mere disperzije)

Parametre varijabiliteta možemo podeliti na apsolutne i relativne. Apsolutni su: -

interval varijacije, interkvartilna razlika, srednje apsolutno odstupanje, srednje kvadratno odstupanje (varijansa), standardna devijacija.

Relativni su: -

koeficijent varijacije, normalizovano standardno odstupanje.

- Interval varijacije. Interval varijacije (Iv) je interval vrednosti obeležja u kome se nalaze vrednosti obeležja svih þlanova populacije (uzorka).

Kod negrupisanih podataka, kao i kod grupisanih podataka diskretnog tipa, izraþunava se kao razlika najveüe i najmanje vrednosti obeležja u ispitivanoj populaciji (uzorku): I v x max  x min . Kod grupisanih podataka neprekidnog tipa, izraþunava se kao razlika gornje granice poslednje klase i donje granice prve klase.

Primer 1.2.2.1. Za podatke iz Primera 1.1.1. izraþunati interval varijacije:

c) broja položenih ispita d) težine anketiranih studenata.

Rešenje:

a) Interval varijacije je I v

x max  x min 32

12  3

9 položenih ispita.

Poslovna statistika

b) Interval varijacije je I v

x max  x min

120  50

70 kg.

- Interkvartilna razlika. Pre nego što definišemo interkvartilnu razliku, definisaüemo sledeüe pojmove: kvartil, decil i percentil. - Kvartili su brojevi, koje üemo obeležavati sa Qi (i 1,...,3) , sa osobinom da i-ti kvartil (Qi) deli interval varijacije u odnosu i : 4  i. To znaþi da Qi predstavlja vrednost obeležja od koje i ˜ 25% elemenata populacije (uzorka) ima vrednost manju ili jednaku od Qi. Oþigledno da je Q2 M e .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti kvartil izraþunavamo po formuli: Qi



N 1 º « i ˜ 4 1» ¬ ¼

· § § N  1 · ª N  1 º · §¨  1» ¸¸ ˜ x ª N 1 º  x ª N 1 º ¸  ¨¨ ¨ i ˜  1¸  «i ˜ 4 4 « i ˜ 4 1» ¸ ¼ ¹ ¨© «¬ i˜ 4  2 »¼ ¹ ¬ ©© ¬ ¼ ¹

i 1,...,3 gde je sa >D @ oznaþen ceo deo broja D . U suštini, ova formula znaþi sledeüe: § N 1 · ukoliko je ¨ i ˜  1¸ ceo broj, tada je vrednost i-tog kvartila jednaka 4 ¹ © § N 1 ·  1¸ -og þlana ureÿene statistiþke serije. vrednosti ¨ i ˜ 4 ¹ ©  N 1 · §  1¸ nije ceo broj, tada se vrednost i-tog kvartila dobija A ukoliko ¨ i ˜ 4 ¹ © · § N 1 · § N 1  1¸ -og i ¨ i ˜  2 ¸ -og þlana linearnom interpolacijom vrednosti ¨ i ˜ 4 4 ¹ ¹ © © ureÿene statistiþke serije.

33

Poslovna statistika Da bismo odredili vrednost i-tog kvartila (Qi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog kvartila Qi ,kl , iz sledeüeg uslova: Qi , kl 1

¦

Q

fi d i ˜

i 1

N i , kl ¢¦ fi 4 i1

i=1,...,3.

Vrednost Qi i=1,...,3 odreÿujemo iz jednaþine Q

Qi

LQi , kl

1

i , kl N i ˜  ¦ fi 4 i 1  ˜' f Qi , kl

gde je: LQi , kl - poþetak klase i-tog kvartila, f Qi , kl - apsolutna frekvencija klase i-tog kvartila,

N - broj þlanova populacije, f i - apsolutna frekvencija i-te klase, ' - širina klasnog intervala. Formule za Qi uzorka su identiþne uz uslov N=n. - Decili su brojevi, koje üemo obeležavati sa Di (i 1,...,9) , sa osobinom da i-ti decil (Di) deli interval varijacije u odnosu i : 10  i. To znaþi da Di predstavlja vrednost obeležja od koje i ˜ 10% elemenata populacije (uzorka) ima vrednost manju ili jednaku od Di. Oþigledno da je D5 M e .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti decil izraþunavamo po formuli: Di



N 1 º « i ˜ 10 1» ¬ ¼

· § § N  1 · ª N  1 º · §¨  1» ¸¸ ˜ x ª N 1 º  x ª N 1 º ¸  ¨¨ ¨ i ˜  1¸  «i ˜ 10 « i ˜ 10 1» ¸ ¼ ¹ ¨© «¬i˜ 10  2 »¼ ¹ ¬ 10 ©© ¬ ¼ ¹

i 1,...,9 34

Poslovna statistika gde je sa >D @ oznaþen ceo deo broja D . U suštini, ova formula znaþi sledeüe: § N 1 · ukoliko je ¨ i ˜  1¸ ceo broj, tada je vrednost i-tog decila jednaka 10 ¹ © § N 1 ·  1¸ -og þlana ureÿene statistiþke serije. vrednosti ¨ i ˜ 10 ¹ ©  N 1 · §  1¸ nije ceo broj, tada se vrednost i-tog decila dobija A ukoliko ¨ i ˜ 10 ¹ © · § N 1 · § N 1  1¸ -og i ¨ i ˜  2 ¸ -og þlana linearnom interpolacijom vrednosti ¨ i ˜ 10 10 ¹ ¹ © © ureÿene statistiþke serije. Da bismo odredili vrednost i-tog decila (Di) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog decila Di ,kl , iz sledeüeg uslova: Di , kl 1

¦

D

fi d i ˜

i 1

N i , kl ¢¦ fi 10 i 1

i=1,...,9.

Vrednost Di i=1,...,9 odreÿujemo iz jednaþine D

Di

LDi , kl

1

i , kl N i ˜  ¦ fi 10 i 1  ˜' , f Di , kl

gde je: LDi , kl - poþetak klase i-tog decila, f Di , kl - apsolutna frekvencija klase i-tog decila,

N - broj þlanova populacije, f i - apsolutna frekvencija i-te klase, ' - širina klasnog intervala. Formule za Di uzorka su identiþne uz uslov N=n. 35

Poslovna statistika - Percentili su brojevi, koje üemo obeležavati sa Pi (i 1,...,99) , sa osobinom da i-ti percentil (Pi) deli interval varijacije u odnosu i : 100  i. To znaþi da Pi predstavlja vrednost obeležja od koje i ˜ 1% elemenata populacije (uzorka) ima vrednost manju ili jednaku od Pi. Oþigledno da je P50 M e .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti percentil izraþunavamo po formuli: Pi



N 1 º « i ˜ 100 1» ¬ ¼

· § § N  1 · ª N  1 º · §¨  1» ¸¸ ˜ x ª N 1 º  x ª N 1 º ¸  ¨¨ ¨ i ˜  1¸  «i ˜ « i ˜ 100 1» ¸ ¼ ¹ ¨© «¬i˜ 100  2 »¼ ¹ ¬ 100 © © 100 ¬ ¼ ¹

i 1,...,99 gde je sa >D @ oznaþen ceo deo broja D .

U suštini, ova formula znaþi sledeüe: § N 1 · ukoliko je ¨ i ˜  1¸ ceo broj, tada je vrednost i-tog percentila jednaka ¹ © 100 § N 1 ·  1¸ -og þlana ureÿene statistiþke serije. vrednosti ¨ i ˜ ¹ © 100 § N 1 ·  1¸ nije ceo broj, tada se vrednost i-tog percentila dobija A ukoliko ¨ i ˜ ¹ © 100 · § N 1 · § N 1  1¸ -og i ¨ i ˜  2 ¸ -og þlana linearnom interpolacijom vrednosti ¨ i ˜ ¹ ¹ © 100 © 100 ureÿene statistiþke serije.

Da bismo odredili vrednost i-tog percentila (Pi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog percentila Pi ,kl , iz sledeüeg uslova: Pi , kl 1

¦ i 1

P

fi d i ˜

N i , kl ¢¦ f i 100 i 1

i=1,...,99.

Vrednost Pi i=1,...,99 odreÿujemo iz jednaþine 36

Poslovna statistika

P

Pi

LPi , kl

1

i , kl N i˜  ¦ fi 100 i 1  ˜' , f Pi , kl

gde je: LPi , kl - poþetak klase i-tog percentila, f Pi , kl - apsolutna frekvencija klase i-tog percentila,

N - broj þlanova populacije, f i - apsolutna frekvencija i-te klase, ' - širina klasnog intervala. Formule za Pi uzorka su identiþne uz uslov N=n. Interkvartilna razlika Iq predstavlja interval vrednosti obeležja u kome se nalazi 50% središnih vrednosti ureÿene serije, i izraþunava se po formuli

Iq

Q3  Q1

P75  P25 .

Ona iskljuþuje 25% podataka sa najnižim vrednostima i 25% podataka sa najvišim vrednostima. U nekim literaturama se þesto definiše i pojam polukvartilne razlike (semikvartilna razlika) i ona je polovina interkvartilne razlike, odnosno važi semikvartilna razlika

Iq 2

.

Primer 1.2.2.2. Za podatke iz Primera 1.1.1. izraþunati interkvartilnu razliku, treüi decil i trideset peti percentil:

a) broja položenih ispita, b) težine anketiranih studenata. Rešenje:

Kako je N=50, važi sledeüe: 37

Poslovna statistika a) · § § 50  1 · ª 50  1 º · §¨  ¨¨ ¨1 ˜  1¸  «1 ˜  1» ¸¸ ˜ x ª 501 º  x ª 501 º ¸ 4 4 «1˜ 4 1» ¸ ¹ ¬ ¼ ¹ ¨© «¬1˜ 4  2 »¼ ©© ¼ ¹ ¬

Q1



Q1

x>13.25 @  13.25  >13.25@ ˜ x>14.25@  x>13.25 @ Ÿ

Q1

x13  0.25 ˜ x14  x13 6  0.25 6  6 6

Q3



Q3

x>37.75 @  37.75  >37.75@ ˜ x>38.75@  x>37.75@ Ÿ

Q3

x37  0.75 ˜ x38  x37 9  0.75 ˜ 9  9 9

50 1 º «1˜ 4 1» ¼ ¬

50 1 º « 3˜ 4 1» ¼ ¬

· § § 50  1 · ª 50  1 º · §¨  ¨¨ ¨ 3 ˜  1¸  «3 ˜  1» ¸¸ ˜ x ª 501 º  x ª 501 º ¸ 4 4 « 3˜ 4 1» ¸ ¹ ¬ ¼ ¹ ¨© «¬3˜ 4  2 »¼ ©© ¼ ¹ ¬

pa je interkvartilna razlika I q

Q3  Q1

96

Ÿ

Ÿ

3 položena ispita.

Treüi decil iznosi: · § § 50  1 · ª 50  1 º · §¨  1» ¸¸ ˜ x ª 501 º  x ª 501 º ¸ Ÿ  ¨¨ ¨ 3 ˜  1¸  «3 ˜ 10 10 « 3˜ 10 1» ¸ ¼ ¹ ¨© «¬ 3˜ 10  2 »¼ ¹ ¬ ©© ¬ ¼ ¹

D3



D3

x>15.7 @  15.7  >15.7@ ˜ x>16.7 @  x>15.7 @

50 1 º « 3˜ 10 1» ¬ ¼

x15  0.7 ˜ x16  x15 6  0.7 ˜ 6  6 6. Trideset peti percentil iznosi:

· §§ 50  1 º · §¨ 50  1 · ª  1» ¸¸ ˜ x ª 501 º  x ª 501 º ¸ Ÿ  ¨¨ ¨ 35 ˜  1¸  «35 ˜ 100 100 « 35˜ 100 1» ¸ ¼ ¹ ¨© «¬35˜ 100  2 »¼ ¹ ¬ ©© ¬ ¼ ¹

P35



P35

x>18.15@  18.15  >18.15@ ˜ x>19.15@  x>18.15 @

50 1 º « 35˜ 100 1» ¬ ¼

x18  0.15 ˜ x19  x18 6  0.15 ˜ 7  6 6.15.

38

Poslovna statistika b) N 4

Kako je

50 4

12,5 to je klasa prvog kvartila >60 -70 kg, pa je prvi

kvartil Q1 Q

Q1

LQ1, kl

1

N 1, kl  ¦ fi 4 i 1  ˜' f Q1, kl

3˜ N 4 je treüi kvartil Q3

3 ˜ 50 4

Kako je

Q

Q3

LQ, kl 3

60 

1

80 

37,5  29 ˜ 10 | 89.44 kg . 9

Q3  Q1

Interkvartilna razlika je I q 3˜ N 10

67.5 kg .

37,5 to je klasa treüeg kvartila >80 -90 kg, pa

3 , kl 3˜ N  ¦ fi 4 i 1  ˜' f Q3, kl

Kako je

12,5  2 ˜ 10 14

3 ˜ 50 10

89.44  67.5

21.94 kg.

15 to je klasa treüeg decila >60 -70 kg, pa je

treüi decil D3 D

D3

LD3, kl

1

3 , kl 3˜ N  ¦ fi 10 i 1  ˜' f D3, kl

60 

15  2 ˜ 10 | 69.29 kg. 14

35 ˜ N 35 ˜ 50 17.5 to je klasa trideset petog percentila 100 100 >70 -80 kg, pa je trideset peti percentil P35 Kako je

35 ˜ P35

LPi , kl 

N  100 f Pi , kl

Pi , kl 1

¦f i 1

i

˜'

70 

17.5  16 | 70.12 kg. 13

39

Poslovna statistika - Srednje apsolutno odstupanje

Srednje apsolutno odstupanje (AD) možemo odrediti u odnosu na aritmetiþku sredinu, modus i medijanu. Srednje apsolutno odstupanje od aritmetiþke sredine oznaþavamo sa AD( P ) __

ukoliko je u pitanju populacija, odnosno sa AD( x ) ukoliko je u pitanju uzorak. Za negrupisane podatke se izraþunava po formuli: N

AD( P )

¦x

P

i

i 1

za populaciju,

N n

__

AD( x )

¦x

__ i

x

i 1

za uzorak,

n

dok se za grupisane podatke izraþunava po formuli: K

AD( P )

¦f

i

˜ xi,  P

i 1

za populaciju,

N K

__

AD( x )

¦

__

f i ˜ xi,  x

i 1

za uzorak.

n

Srednje apsolutno odstupanje od modusa oznaþavamo sa AD( M o ) i za negrupisane podatke populacije se izraþunava po formuli: N

¦x AD( M o )

i

 Mo

i 1

N

dok se za grupisane podatke izraþunava po formuli:

40

Poslovna statistika K

¦f AD( M o )

˜ xi,  M o

i

i 1

N

.

Formule za AD(Mo) uzorka su identiþne uz uslov N=n. Srednje apsolutno odstupanje od medijane oznaþavamo sa AD( M e ) i za negrupisane podatke populacije se izraþunava po formuli: N

¦x AD( M e )

i

 Me

i 1

N

dok se za grupisane podatke izraþunava po formuli: K

¦f AD( M o )

i

˜ xi,  M e

i 1

N

.

Formule za AD(Me) uzorka su identiþne uz uslov N=n. N

¦x

i

A

i 1

ima minimum kada je A M e , N odnosno za negrupisane podatke je srednje apsolutno odstupanje od medijane najmanje.

Interesantno je napomenuti da zbir

Primer 1.2.2.3. Za podatke iz Primera 1.1.1. izraþunati srednje apsolutno odstupanje od aritmetiþke sredine

a) broja položenih ispita, b) težine anketiranih studenata. Podatke analizirati kao grupisane.

41

Poslovna statistika Rešenje:

a) Srednje apsolutno odstupanje broja položenih ispita od aritmetiþke sredine je

10

AD P

¦f

i

˜ xi,  P

i 1

N 2 ˜ 3  7.44  5 ˜ 4  7.44  3 ˜ 5  7.44  8 ˜ 6  7.44  9 ˜ 7  7.44

50 7 ˜ 8  7.44  6 ˜ 9  7.44  3 ˜ 10  7.44  4 ˜ 11  7.44  3 ˜ 12  7.44



50 2 ˜ 4.44  5 ˜ 3.44  3 ˜ 2.44  8 ˜ 1.44  9 ˜ 0.44  7 ˜ 0.56  6 ˜ 1.56  50 3 ˜ 2.56  4 ˜ 3.56  3 ˜ 4.56 1,9552 50 b) Srednje apsolutno odstupanje težine od aritmetiþke sredine je

7

AD P

¦f

i

˜ xi,  P

i 1

N 2 ˜ 55  79.6  14 ˜ 65  79.6  13 ˜ 75  79.6  9 ˜ 85  79.6  6 ˜ 95  79.6 50



4 ˜ 105  79.6  2 ˜ 115  79.6 50 2 ˜ 24.6  14 ˜ 14.6  13 ˜ 4.6  9 ˜ 5.4  6 ˜ 15.4  4 ˜ 25.4  2 ˜ 35.4 50 42

12.536 kg.

Poslovna statistika - Srednje kvadratno odstupanje (varijansa)

Srednje kvadratno odstupanje (varijansu) üemo posebno izraþunavati i obeležavati u zavisnosti od toga da li raþunamo varijansu populacije ili uzorka. Razlozi zbog kojih se naþin izraþunavanja varijanse populacije razlikuje od naþina izraþunavanja varijanse uzorka, biüe objašnjen u kasnijim poglavljima ovog udžbenika.

- Varijansa populacije

Varijansu populacije obeležavamo sa V 2 i izraþunavamo po formuli: N

¦ x

V2

i

 P

2

i 1

za negrupisane podatke,

N K

¦ f ˜ x i

V2

, i

P



2

i 1

za grupisane podatke.

N

Imajuüi u vidu da važi sledeüe: N

2 ¦ xi  P i 1

N

¦ x

N

2 i

 2 ˜ xi ˜ P  P 2

i 1

N i 1

N

i 1

N

N

¦x

¦x N

N

2 i

 2˜P ˜P  P2

¦x i 1

N

2 i

 P2

i

43

N

2 i

 2˜P ˜

¦ xi i 1

N

N



¦P i 1

N

2

Poslovna statistika K

¦ f ˜ x i

, i

P



K



2

¦f

i

2

˜ xi,  2 ˜ xi, ˜ P  P 2

N

N

K

¦

f i ˜ xi,

 2˜P ˜

N K

i

K

2

i 1

¦f



i 1

i 1

˜ xi,

¦

K

f i ˜ xi,

i 1



N

 2˜P ˜P  P2

N

i

˜P2

i 1

N

K

2

i 1

¦f

¦f

i

˜ xi,

i 1

N

2

 P2

varijansa populacije se može izraþunavati i po sledeüim (tzv. radnim) formulama: N

V2

¦x

2 i

 P2

i 1

N K

V2

¦f

i

˜ xi,

i 1

N

za negrupisane podatke,

2

 P2

za grupisane podatke.

-Varijansa uzorka

Naþin izraþunavanja i obeležavanja varijanse uzorka zavisi od toga da li je aritmetiþka sredina populacije (P), iz koje je uzorak uzet, poznata ili ne. U sluþaju kada je aritmetiþka sredina populacije (P) poznata, varijansu uzorka obeležavamo sa s 2 i izraþunavamo po formuli: n

s2

n

¦ x i  P 2

¦x

n

n

i 1

i 1

2 i

 P2

za negrupisane podatke,

44

Poslovna statistika K

¦ f ˜ x i

s2

, i

P

K



2

¦f

i

˜ xi,

2

 P2

i 1

i 1

n

n

za grupisane podatke.

U sluþaju kada je aritmetiþka sredina populacije (P) nepoznata, varijansu uzorka obeležavamo sa s c2 i izraþunavamo po formuli:

n

__ § · x  ¨ i x¸ ¦ ¹ i 1© n 1

s c2

K

s

¦

2 c

i 1

2

za negrupisane podatke,

__ § · f i ˜ ¨ xi,  x ¸ © ¹ n 1

2

za grupisane podatke,

__

gde je sa x obeležena aritmetiþka sredina ispitivanog uzorka.

Imajuüi u vidu da važi sledeüe: n

__ § · ¨ xi  x ¸ ¦ ¹ i 1© n 1

__ __ 2 · § 2 ¨ ¸ x x  2 ˜ ˜ ¦ i x x ¸ ¨ i i 1© ¹ n 1

2

n

n

¦x

__

__ 2

n˜ x n˜ x  2 ˜ x˜  n 1 n 1 n 1

i 1

__

¦x

2 i

¦x

n 1

n˜ x

i 1

n 1

i

45

n __ 2

n

2 i

i 1

__ 2

n

2 i

n

__

 2 ˜ x˜

¦x ¦ x i

i 1

n 1



i 1

n 1

Poslovna statistika K

¦ i 1

__ § · f i ˜ ¨ xi,  x ¸ © ¹ n 1 K

¦f

˜x

i

i 1

K

˜x

,2 i

i 1

n 1

__ __ 2 · § 2 f i ˜ ¨¨ xi,  2 ˜ xi, ˜ x  x ¸¸ © ¹ n 1

K

__

 2 ˜ x˜

n 1 i

K

¦

,2 i

i 1

¦f

2

¦f

__ 2

K

i

˜x

i 1

n 1

, i



¦f

i

˜x

i 1

n 1 K

__

__ 2

n˜ x n˜ x  2 ˜ x˜  n 1 n 1 __

¦f

i

,2 i

__ 2

˜x n˜ x

i 1

n 1

varijansa uzorka se, u sluþaju ne poznavanja aritmetiþke sredine populacije, može izraþunavati i po sledeüim formulama: __ 2

n

s

2 c

¦x

2 i

s

za negrupisane podatke,

n 1 K

2 c

 n˜ x

i 1

¦f

i

,2 i

__ 2

˜x  n˜ x

i 1

n 1

za grupisane podatke.

Primer 1.2.2.4. Za podatke iz Primera 1.1.1. izraþunati varijansu:

a) broja položenih ispita, b) težine anketiranih studenata. Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

46

Poslovna statistika Rešenje:

a) Varijansa broja položenih ispita je 10

¦ f ˜ x i

V2

, i

P



2

i 1

N 2 2 2 2 2 2 ˜ 3  7.44  5 ˜ 4  7.44  3 ˜ 5  7.44  8 ˜ 6  7.44  9 ˜ 7  7.44  50 2 2 2 2 2 7 ˜ 8  7.44  6 ˜ 9  7.44  3 ˜ 10  7.44  4 ˜ 11  7.44  3 ˜ 12  7.44 50 2 2 2 2 2 2 ˜  4.44  5 ˜  3.44  3 ˜  2.44  8 ˜  1.44  9 ˜  0.44  50 7 ˜ 0.56 2  6 ˜ 1.56 2  3 ˜ 2.56 2  4 ˜ 3.56 2  3 ˜ 4.56 2 5.6864 50

b) Varijansa težine je 7

¦ f ˜ x i

V2

, i

P



2

i 1

N 2 2 2 2 2 ˜ 55  79.6  14 ˜ 65  79.6  13 ˜ 75  79.6  9 ˜ 85  79.6  50 2 2 2 6 ˜ 95  79.6  4 ˜ 105  79.6  2 ˜ 115  79.6 50 2 2 2 2 ˜  24.6  14 ˜  14.6  13 ˜  4.6  9 ˜ 5.4 2  50 6 ˜ 15.4 2  4 ˜ 25.4 2  2 ˜ 35.4 2 224,84. 50

47

Poslovna statistika - Standardna devijacija

Standardna devijacija je kvadratni koren varijanse i obeležava se i izraþunava po sledeüim formulama: -

standardna devijacija populacije (V)

V -

standardna devijacija uzorka kada je P poznato (s) s

-

V2

s2

standardna devijacija uzorka kada P nije poznato ( s c ) sc

s c2 .

Primer 1.2.2.5. Za podatke iz Primera 1.1.1. izraþunati standardnu devijaciju:

a) broja položenih ispita, b) težine anketiranih studenata. Podatke analizirati kao grupisane i smatrati da se radi o populaciji. Rešenje:

Imajuüi u vidu rešenje Primera 1.2.2.4. dobijamo: a) standardna devijacija broja položenih ispita iznosi

V

V2

5.6864 | 2.38

b) standardna devijacija težine studenata iznosi

V

V2

224.84 | 14.99 kg. 48

Poslovna statistika Aritmetiþka sredina i standardna devijacija u nekoj meri odreÿuju raspored vrednosti obeležja analiziranih podataka u populaciji (uzorku). Naime, na osnovu ýebiševljeve teoreme, koju ovde neüemo prezentovati, definisano je sledeüe pravilo, poznato kao ýebiševljevo pravilo: u r k standardnih devijacija oko aritmetiþke sredine nalazi se bar 1 · § ¨1  2 ¸ ˜ 100% vrednosti obeležja podataka analizirane populacije (uzorka). © k ¹ Ovo pravilo važi za k!1 , kR. Dakle: -

-

-

1 · § bar ¨1  2 ¸ ˜ 100% 75% podataka ima vrednost obeležja u intervalu © 2 ¹ r2 standardne devijacije oko aritmetiþke sredine; 1· § bar ¨1  2 ¸ ˜ 100% 88,89% podataka ima vrednost obeležja u © 3 ¹ intervalu r3 standardne devijacije oko aritmetiþke sredine; 1 · § bar ¨1  2 ¸ ˜ 100% 93,75% podataka ima vrednost obeležja u © 4 ¹ intervalu r4 standardne devijacije oko aritmetiþke sredine.

- Koeficijent varijacije

Koeficijent varijacije obeležavamo sa Cv i izraþunavamo po sledeüim formulama: -

koeficijent varijacije populacije Cv

-

V P

koeficijent varijacije uzorka kada je P poznato

49

Poslovna statistika

Cv

s __

x koeficijent varijacije uzorka kada P nije poznato

-

Cv

sc __

.

x

Kada koeficijent varijacije izražavamo u procentima, obeležavamo ga sa Cv% i izraþunavamo po formuli

Cv %

C v ˜ 100%.

Koeficijent varijacije je relativni parametar koji ukazuje na nivo homogenosti posmatranog obeležja u populacija (uzorku). Što je koeficijent varijacije veüi, to je homogenost manja, odnosno populacija (uzorak) je nestabilnija u aspektu vrednosti posmatranog obeležja. Pomoüu ovog parametra može se uporeÿivati homogenost razliþitih obeležja u razliþitim populacijama (uzorcima). Ovaj parametar, dakle, opisuje svojstvo þitave populacije, pa se þesto kaže da ima integralni karakter. Primer 1.2.2.6. Za podatke iz Primera 1.1.1. izraþunati koeficijent varijacije:

a) broja položenih ispita, b) težine anketiranih studenata. Podatke analizirati kao grupisane i smatrati da se radi o populaciji. Rešenje:

a) Koeficijent varijacije broja položenih ispita iznosi Cv Cv %

V P

2.38 | 0.32 7.44 32%

50

Poslovna statistika b) Koeficijent varijacije težine iznosi

V P

14.99 | 0.188 79.6 C v % 18.8% Cv

Raspodeljenost broja položenih ispita ovih studenata nestabilnija je od raspodeljenosti njihovih težina.

- Normalizovano standardno odstupanje

Normalizovano standardno odstupanje je relativni parametar koji ukazuje na odstupanje odreÿenog (i-tog) þlana populacije (uzorka) u odnosu na aritmetiþku sredinu te populacije (uzorka), imajuüi u vidu i stepen stabilnosti vrednosti obeležja u toj populaciji (uzorka). Pomoüu ovog parametra mogu se uporeÿivati individualni þlanovi iz razliþitih populacija. Normalizovano standardno odstupanje i-tog þlana, þija je vrednost obeležja xi, obeležavamo sa Zi i izraþunavamo po sledeüim formulama: -

Zi i-tog þlana populacije Zi

-

xi  P

V

,

Zi i-tog þlana uzorka kada je P poznato __

Zi -

xi  x , s

Zi i-tog þlana kada P nije poznato __

Zi

xi  x . sc 51

Poslovna statistika Primer 1.2.2.7. Student koji pripada populaciji iz Primera 1.1.1. ima 75 kg. i položio je 7 ispita. Naüi normalizovano odstupanje:

a) broja položenih ispita, b) težine ovog studenta.

Rešenje:

a) Normalizovano odstupanje broja položenih ispita ovog studenta iznosi

Zi

xi  P

V

7  7.44 | 0.185 . 2.38

b) Normalizovano odstupanje težine ovog studenta iznosi

Zi

xi  P

V

75  79.6 | 0.307 . 14.99

Ovaj student je i u jednom i u drugom sluþaju ispod proseka svoje populacije, ali više odstupa u težini nego u položenim ispitima.

52

Poslovna statistika 1.2.3. Parametri oblika rasporeda (mere oblika rasporeda)

Mere oblika rasporeda su mera simetrije i mera spljoštenosti. U ovom udžbeniku analiziraüemo samo mere oblika rasporeda za populaciju, dok se analizom mera oblika rasporeda uzorka neüemo baviti.

Mera simetrije se izražava pomoüu koeficijenta simetrije, dok se mera spljoštenosti izražava pomoüu koeficijenta spljoštenosti. I jedan i drugi koeficijent se izraþunavaju pomoüu centralnih momenata.

- Centralni moment reda k oznaþavamo sa Mk i izraþunavamo po formuli: N

¦ x Mk

i

 P

k

i 1

za negrupisane podatke,

N k

K

¦ f ˜ x i

Mk

i 1

N

, i

P



za grupisane podatke.

- Koeficijent simetrije oznaþavamo sa D3 i izraþunavamo po formuli:

D3

M3

V3

.

Ukoliko je:

D3=0

zakljuþujemo da je raspodela vrednosti obeležja simetriþna; tada je takoÿe P M e M o ;

53

Poslovna statistika D3!0

zakljuþujemo da je raspodela vrednosti obeležja pozitivno asimetriþna (asimetrija udesno); tada je takoÿe P ! M e ! M o ;

D30

zakljuþujemo da je raspodela vrednosti obeležja negativno asimetriþna (asimetrija ulevo); tada je takoÿe P  M e  M o (Slika 1.2.3.1).

fi

a

b

D3=0 P=Me=M0

c

D3!0 P!Me!M0 a) b) c)

D30 PMeM0

Simetriþan raspored Pozitivno asimetriþan raspored Negativno asimetriþan raspored

Slika 1.2.3.1. Oblici rasporeda frekvencija u smislu simetrije

U praksi se þesto koristi sledeüa podela:

D 3 ¢0.1

smatra se da nema asimetrije,

0.1 d D 3 ¢ 0.25

mala asimetrija,

0.25 d D 3 ¢ 0.5

srednja asimetrija,

0.5 d D 3

jaka asimetrija. 54

xi

Poslovna statistika - Koeficijent spljoštenosti oznaþavamo sa D4 i izraþunavamo po formuli:

D4

M4

V4

.

Ukoliko je:

D4=3

zakljuþujemo da je raspodela vrednosti obeležja normalno spljoštena;

D3!3

zakljuþujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

D30

zakljuþujemo da raspodela vrednosti obeležja ima spljoštenost veüu od normalne.

Zadatak 1.2.3.1. Za podatke iz Primera 1.1.1. izraþunati mere oblika rasporeda (koeficijent simetrije i spljoštenosti):

c) broja položenih ispita, c) težine anketiranih studenata. Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

55

Poslovna statistika

2. OSNOVNI POJMOVI TEORIJE VEROVATNOûE Na današnjem nivou razvoja ljudske svesti „sluþajnost” kao pojava tretira se dvojako. Pobornici takozvanog kauzalnog shvatanja, mišljenja su da su sva dešavanja u univerzumu (a tu spadaju i ponašanja ljudskog uma) deterministiþka, odnosno uzroþno-poslediþna. Za pojedine pojave, otkrivanje njihovih uzroka i naþina (zakonitosti) po kojima uzroci deluju na pojavu kao posledicu, „preveli” su tu pojavu iz domena sluþajne pojave u domen potpuno odreÿene pojave, þije su mesto, veliþina i trenutak pojave, u našem þetvorodimenzionalnom prostornovremenskom okruženju, potpuno opisani. Na primer, sigurno je da je pojava Halejeve komete na nebu za nekog posmatraþa od pre hiljadu godina bila jedan sluþajan dogaÿaj. Danas, putanja Halejeve komete je potpuno opisana i vreme i mesto njene pojave potpuno su odreÿeni, a ne sluþajni. Svako otkrivanje uzroþno-poslediþne zavisnosti odreÿenih pojava utemeljilo je odreÿenu fundamentalnu nauþnu teoriju (opšta teorija relativnosti, teorija elektromagnetizma, i sl.), u okviru kojih se analiza vrši po utvrÿenim i nepromenjlivim pravilima, opisanim kroz odreÿene matematiþke jednaþine, i gde „sluþajnost” kao pojam uopšte ne postoji. Ovakav pristup smatra da su odreÿeni „sluþajni” dogaÿaji, u stvari, dogaÿaji þije mnogobrojne i složene uzroþno-poslediþne veze sa poznatim i nepoznatim uzrocima još nismo otkrili. Zbog toga vreme, prostor i formu njihovog pojavljivanja ne možemo predvideti, pa ih nazivamo „sluþajnim”, dok oni to u stvari nisu. Pristalice drugog pristupa smatraju da sluþajnost zaista postoji u univerzumu, i da je „sluþajno” pojavljivanje, pojavljivanje bez ikakvog uzroka i zakonitosti odreÿenih dogaÿaja, jedna od fundamentalnih karakteristika univerzuma. Po tom pristupu, kauzalnost odreÿenih pojava nije postulat, veü „sluþajnost” veoma velike verovatnoüe. Toliko velike da je vreme u kome analiziramo, pa i živimo po toj kauzalnosti, izuzetno kratko, pa je verovatnoüa da se do sada pojavio dogaÿaj koji bi opovrgnuo odreÿeni kauzalni zakon veoma mala. Zbog toga se jedan takav dogaÿaj, „perpetum mobile”, „sluþajno” nije ni pojavio, te otud „zabluda” o deterministiþnosti univerzuma. Nauþna utemeljenost ovakvog pristupa ogleda se u Hajzenbergovoj relaciji neodreÿenosti i raznim kvantnim teorijama. Najveüi mislioci današnjeg vremena nisu se egzaktno opredelili ni za jedan od ovih pristupa, veü pokušavaju da objedine ova dva pristupa u neku jedinstvenu 56

Poslovna statistika teoriju, a do tada se koriste zakonitostima jednog ili drugog pristupa u zavisnosti od prirode analiziranih pojava. Bez obzira kako tretiramo sluþajnost, ona ima svoje zakonitosti i upravo je teorija verovatnoüe matematiþka teorija koja analizira te zakonitosti na modelima stvarnih pojava, dok je statistiþka teorija, pogotovu njen metod uzorkovanja, uspostavljavanje veze izmeÿu stvarnih pojava i matematiþkih modela. Uopšteno, svi matematiþki modeli stvarnih pojava koje analiziramo metodama verovatnoüe, svrstavaju se u kategoriju statistiþkog eksperimenta, a to je eksperiment koji zadovoljava sledeüe uslove: 3. može se ponavljati (realno ili misaono) proizvoljan broj puta pod istim uslovima; 4. unapred je definisano šta se registruje u eksperimentu i poznati su svi moguüi ishodi, kojih može biti konaþno mnogo, i prebrojivo ili neprebrojivo beskonaþno mnogo; 5. ishod svakog buduüeg pojedinaþnog eksperimenta nije unapred poznat. Nad ishodima ovakvog eksperimenta, statistiþkog eksperimenta, definišemo sledeüe pojmove: -

elementarni dogaÿaj je skup þiji je element svaki moguüi pojedinaþni ishod statistiþkog eksperimenta; siguran dogaÿaj je skup svih ishoda eksperimenta, odnosno skup svih elementarnih dogaÿaja, i obeležavaüemo ga sa S; dogaÿaj (ili sluþajan dogaÿaj) je svaki podskup sigurnog dogaÿaja, odnosno svaki podskup skupa S, i njih üemo obeležavati velikim slovima A, B, C...

Važno je istaüi da su dogaÿaji definisani kao skupovi i da se teorija verovatnoüe primenjuje na ovako definisanim dogaÿajima. Nemoguü dogaÿaj u nekom statistiþkom eksperimentu je bilo koja pojava koja nije podskup sigurnog dogaÿaja, i obeležavamo ga kao prazan skup ‡.

Jedan od uobiþajenih primera statistiþkog eksperimenta je bacanje kockice za jamb (kocka þije su strane obeležene brojevima od 1 do 6), gde se registruje broj koji je pao sa gornje strane kocke. 57

Poslovna statistika

Kod ovog statistiþkog eksperimenta postoji šest elementarnih dogaÿaja; obeležimo ih sa Ai (i = 1, 2, ..., 6), gde je:

^1` - pala je jedinica; ^2`- pala je dvojka;

A1 A2



A6

^6` - pala je šestica.

Siguran dogaÿaj je skup S

^1,2,3,4,5,6,`- da padne bilo koji ceo broj od 1 do 6, ukljuþujuüi i 1 i 6.

Recimo, dogaÿaj da padne paran broj veüi od 3 je skup koji üemo obeležiti sa B i þiji su elementi B

^4,6` i svakako da je

B  S.

Dogaÿaj da padne broj veüi od 26 je nemoguü dogaÿaj.

2.1. Algebra dogaÿaja

Kako su dogaÿaji definisani kao skupovi, to se operacije sa dogaÿajima u skupu S definišu na isti naþin kao i operacije sa skupovima. - Podskup dogaÿaja. Kažemo da je dogaÿaj A podskup dogaÿaja B ukoliko su svi elementarni dogaÿaji koji þine dogaÿaj A istovremeno i elementarni dogaÿaji koji þine dogaÿaj B, i to zapisujemo

A  B. U tom sluþaju kažemo da dogaÿaj A implicira dogaÿaj B, da je dogaÿaj A deo dogaÿaja B ... - Jednakost (ekvivalentnost) dogaÿaja. Dogaÿaji A i B su jednaki ukoliko je

A  B š B  A i tada zapisujemo A

B.

58

Poslovna statistika

- Suprotan dogaÿaj. Suprotan dogaÿaj dogaÿaju A je dogaÿaj koji se realizuje kada se prilikom izvoÿenja statistiþkog eksperimenta ne realizuje dogaÿaj A. Suprotan dogaÿaj je skup koji se sastoji od svih elementarnih dogaÿaja statistiþkog eksperimenta, koji ne pripadaju dogaÿaju A . Obeležava __

se sa A i važi __

A

S \ A gde je sa „ \ ” oznaþena operacija „razlika skupova”.

- Zbir dogaÿaja. Zbir dogaÿaja A i B , u oznaci A+B, predstavlja dogaÿaj koji se realizuje u pojavi bar jednog od dogaÿaja A ili B. Skup koji predstavlja dogaÿaj A+B je skup A ‰ B. n

Uopšte, zbir konaþno mnogo dogaÿaja A1, A2, ..., An, u oznaci

¦A

i

,

i 1

predstavlja dogaÿaj koji se realizuje u pojavi bar jednog od dogaÿaja Ai, n

n

(i=1,2,...,n). Skup koji predstavlja dogaÿaj

¦ Ai je skup i 1

A. i

i 1

Dogaÿaji A1, A2, ..., An, þine potpun sistem dogaÿaja ukoliko se bar jedan od n

njih pojavi pri realizaciji eksperimenta, to jest ako važi

¦A

S.

i

i 1

- Proizvod dogaÿaja. Proizvod dogaÿaja A i B, u oznaci A ˜ B , predstavlja dogaÿaj koji se realizuje pojavom i dogaÿaja A i dogaÿaja B. Skup koji predstavlja dogaÿaj A ˜ B , je skup A ˆ B. n

Uopšte, proizvod konaþno mnogo dogaÿaja A1, A2, ..., An, u oznaci

–A , i

i 1

predstavlja dogaÿaj koji se realizuje istovremenom pojavom svih dogaÿaja Ai, n

(i=1,2,...,n). Skup koji predstavlja dogaÿaj

– Ai , je skup i 1

n

A. i

i 1

Za dogaÿaje A i B kažemo da se iskljuþuju (uzajamno iskljuþivi dogaÿaji, nesaglasni dogaÿaji) ako se ne mogu istovremeno dogoditi, odnosno ako je A ˜ B ‡. Uopšte, dogaÿaji A1, A2, ... su uzajamno iskljuþivi ako je Ai ˜ A j

i , j=1,2,..., izj. 59

‡ za svako

Poslovna statistika

Ukoliko dogaÿaji A1, A2, ..., An, þine potpun sistem dogaÿaja i meÿusobno su iskljuþivi, onda dogaÿaji A1, A2, ..., An, þine potpun sistem hipoteza pri realizaciji eksperimenta. - Razlika dogaÿaja. Razlika dogaÿaja A i B , u oznaci A-B, predstavlja dogaÿaj koji se realizuje kada se realizuje dogaÿaj A i ne realizuje dogaÿaj B. Skup koji predstavlja dogaÿaj A-B, jeste skup A \ B. __

Iz definicije razlike dogaÿaja sledi A  B

A˜ B .

Primer 2.1.1. Obeležimo sa A dogaÿaj da prilikom bacanja kockice za jamb padne paran broj veüi od 2, a sa B dogaÿaj da padne broj veüi od 3. __

Naüi A+B, A, A ˜ B, A  B, B  A. Rešenje:

Kako je po uslovu zadatka A A B

^4,6` , a

B

^4,5,6`

__

A ^1,2,3,5` A ˜ B ^4,6` A B ‡ B  A ^5`.

60

^4,5,6`, to je

Poslovna statistika 2.2. Verovatnoüa

Kako je intuitivno jasno da se neki „sluþajni” dogaÿaji javljaju þešüe (ili reÿe) od nekih drugih „sluþajnih” dogaÿaja, pojavila se potreba za uvoÿenjem odreÿene mere koja bi na pravi naþin predstavljala meru da se odreÿeni „sluþajni” dogaÿaj desi. Ta mera, odnosno broj koji dodeljujemo odreÿenom „sluþajnom” dogaÿaju, a koji predstavlja meru pojavljivanja tog dogaÿaja, nazivamo verovatnoüom tog dogaÿaja.

2.2.1. Definicija verovatnoüe

Za razne vrste dogaÿaja definisale su se razne verovatnoüe, ali je 1933. godine ruski matematiþar A. N. Kolmogorov, postavio jednu sveobuhvatnu, tzv. aksiomatsku definiciju verovatnoüe, koja glasi: - Aksiomatska definicija verovatnoüe. Neka je dat skup S. Funkcija P koja svaki podskup skupa S preslikava na skup R, za koju važi P S 1 (normiranost) A  S P A t 0 (nenegativnost) Ako su A1, A2, A3,... podskupovi iz S , takvi da važi §v · v (iz j) AiˆAj=‡, onda važi jednakost P¨¨  Ai ¸¸ ¦ P Ai . ©i 1 ¹ i 1 (aditivnost) naziva se verovatnoüom na skupu S.

Aksioma 1. Aksioma 2. Aksioma 3.

Ova aksiomatska definicija verovatnoüe je preambiciozna za nivo ovog udžbenika, pa je neüemo koristiti u našim izraþunavanjima, veü üemo verovatnoüu izraþunavati ili na osnovu tzv. klasiþne definicije verovatnoüe (a priori verovatnoüa) ili na osnovu statistiþke definicije verovatnoüe (a posteriori verovatnoüa), u zavisnosti od prirode sluþajnog dogaÿaja þiju verovatnoüu izraþunavamo. Naravno, i klasiþna i statistiþka definicija verovatnoüe su u saglasnosti sa aksiomatskom definicijom, odnosno predstavljaju njene specijalne sluþajeve.

61

Poslovna statistika - Klasiþna definicija verovatnoüe. Neka skup S sadrži nv jednakoverovatnih elementarnih dogaÿaja. Ako skup A sadrži m elementarnih m dogaÿaja, tada je verovatnoüa dogaÿaja A, u oznaci P(A), jednaka P A . n Elementarne dogaÿaje koji odreÿuju dogaÿaj A nazivamo povoljnim ishodima za dogaÿaj A.

Ova klasiþna definicija se može koristiti kada su svi elementarni dogaÿaji jednako verovatni i kada ih ima prebrojivo konaþno mnogo. Zove se još i a priori verovatnoüa jer se može izraþunati pre izvoÿenja statistiþkog eksperimenta.

Primer 2.2.1.1. Naüi verovatnoüu da prilikom bacanje kocke za jamb padne paran broj veüi od 2. Rešenje:

Skup svih elementarnih dogaÿaja je u ovom sluþaju S ^1,2,3,4,5,6`, a traženi dogaÿaj, obeležimo ga sa A, odreÿen je sledeüim elementarnim dogaÿajima 2 1 A ^4,6` , pa je verovatnoüa ovog dogaÿaja P ( A) . 6 3 ýinjenica da je za dogaÿaje kod kojih se može primeniti klasiþna definicija verovatnoüe, relativna frekvencija pojavljivanja odreÿenog dogaÿaja u velikom broju eksperimenata veoma bliska verovatnoüi, omoguüava nam da pretpostavimo da i u opštem sluþaju postoji neka konstanta oko koje se koleba relativna frekvencija pojavljivanja nekog „sluþajnog” dogaÿaja. Prirodno je tu konstantu nazvati verovatnoüom, u ovom sluþaju statistiþkom verovatnoüom posmatranog dogaÿaja. - Statistiþka definicija verovatnoüe. Ukoliko se prilikom velikog broja ponavljanja statistiþkog eksperimenta zapazi da se relativna frekvencija dogaÿaja A skoro za svaku veliku seriju eksperimenata samo neznatno razlikuje od neke (generalno nepoznate) konstante, kažemo da je ta konstanta statistiþka verovatnoüa dogaÿaja A.

ýebiševljev i Hinþinov Zakon velikih brojeva, koji ovde neüemo izlagati, dozvoljava nam da statistiþku verovatnoüu dogaÿaja A možemo dovoljno 62

Poslovna statistika dobro oceniti relativnom frekvencijom pojavljivanja dogaÿaja A u velikoj seriji statistiþkih eksperimenata. Dakle, ako je m broj pojavljivanja dogaÿaja A u seriji od n statistiþkih eksperimenata, onda je statistiþka verovatnoüa, P(A), približno jednaka m P( A) | , n §m · H ! 0 lim nov P¨¨  P( A)  H ¸¸ 1 . i važi sledeüe: © n ¹ Ova poslednja formula znaþi da kada broj realizacije statistiþkog eksperimenta teži u beskonaþnost, verovatnoüa da relativna frekvencija teži statistiþkoj verovatnoüi, teži jedinici. Statistiþka verovatnoüa se zove još i a posteriori verovatnoüa jer se izraþunava posle izvoÿenja statistiþkog eksperimenta.

Primer 2.2.1.2. Proizvoÿaþ automobilskih guma je testirao izdržljivost svojih guma na preÿenih 20.000 km. Od 150.000 ispitivanih guma, njih 900 nije izdržalo 20.000 km. Kolika je verovatnoüa da guma ovog proizvoÿaþa ne izdrži put od 20.000 km. Rešenje:

Na osnovu statistiþke definicije verovatnoüe, verovatnoüa da guma ovog 900 proizvoÿaþa ne izdrži put od 20.000 km je 0.006. 150000

63

Poslovna statistika 2.2.2. Osobine verovatnoüe

Osobine verovatnoüe koje üemo ovde prikazati su dokazive iz aksiomatske definicije verovatnoüe, ali ih neüemo dokazivati veü samo navesti. Neka je dat skup elementarnih dogaÿaja S i neka je na njemu definisana verovatnoüa P. Tada za A, B  S važi sledeüe: 1.

0 d P( A) d 1

(Verovatnoüa je uvek broj izmeÿu 0 i 1.)

2.

P(‡)=0

(Verovatnoüa nemoguüeg dogaÿaja je 0.)

3.

P ( A)  P ( A) 1

4.

P ( A  B) P( A)  P( B)  P( A ˜ B) (Verovatnoüa zbira dva dogaÿaja jednaka je zbiru verovatnoüa tih dogaÿaja umanjenom za verovatnoüu proizvoda tih dogaÿaja.)

__

(Zbir verovatnoüa dogaÿaja i njemu suprotnog dogaÿaja je 1.)

Primer 2.2.2.1. Neka su A i B dogaÿaji kod kojih je verovatnoüa P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Naüi verovatnoüu da se dogodi bar jedan od dogaÿaja A i B. Rešenje:

Dogaÿaj da se dogodi bar jedan od dogaÿaja A i B je dogaÿaj A+B, pa je verovatnoüa tog dogaÿaja jednaka P( A  B)

5.

P( A)  P( B )  P( A ˜ B)

0.45  0.30  0.25

0.5

P ( A  B) P( A)  P( A ˜ B) (Verovatnoüa dogaÿaja „A razlika B” jednaka je razlici verovatnoüe dogaÿaja A i dogaÿaja A ˜ B .)

64

Poslovna statistika Primer 2.2.2.2. Neka su A i B dogaÿaji kod kojih je verovatnoüa P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Naüi verovatnoüu da se dogodi dogaÿaj A a ne dogodi dogaÿaj B. Rešenje:

Dogaÿaj da se dogodi dogaÿaj A a ne dogodi dogaÿaj B, je dogaÿaj A-B, pa je verovatnoüa tog dogaÿaja jednaka P( A  B)

6.

P( A)  P( A ˜ B)

0.45  0.25

0.20 .

Uslovna verovatnoüa. Uslovna verovatnoüa dogaÿaja A, pod uslovom da se dogodio dogaÿaj B, P(B)z0, oznaþava se sa P(A_B) i definiše sa

P(A_B)=

P( A ˜ B) . P( B)

Primer 2.2.2.3. Neka su A i B dogaÿaji kod kojih je verovatnoüa P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Naüi verovatnoüu da se dogodi dogaÿaj A pod uslovom da se dogodio dogaÿaj B. Rešenje:

Verovatnoüa da se dogodi dogaÿaj A pod uslovom da se dogodio dogaÿaj B iznosi

P(A_B)=

7.

P( A ˜ B) P( B)

0.25 | 0.83. 0.30

Nezavisnost dogaÿaja. Za dogaÿaje A i B kažemo da su nezavisni ako je P ( A ˜ B ) P( A) ˜ P( B) .

Oþigledno da za ove dogaÿaje važi

65

Poslovna statistika

P( A ˜ B) P( B)

P(A_B)=

P( A) ˜ P( B) P( B)

P ( A) .

Primer 2.2.2.4. Neka su A i B dogaÿaji kod kojih je verovatnoüa P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Da li su dogaÿaji A i B nezavisni dogaÿaji? Rešenje:

Kako je P( A) ˜ P( B) 0.45 ˜ 0.30 P ( A ˜ B) 0.25

0.135

to je P ( A ˜ B) z P ( A) ˜ P( B) , pa ovi dogaÿaji nisu nezavisni.

8.

Formula totalne verovatnoüe. Ako H1, H2, ..., Hn þine potpun sistem hipoteza u odnosu na dogaÿaj A, tada je n

P ( A)

¦

P(A_Hi)˜P(Hi).

i 1

Primer 2.2.2.5. ýetiri kooperanta proizvode jedan deo nekog aparata. Kooperant A podmiruje 30% potreba, B 20% a C i D po 25 % potreba. Uoþeno je da kooperant A šalje fabrici 10% neispravnih delova, B 15%, C 5% i D 8% neispravnih delova. Naüi verovatnoüu da je u sluþajno izabrani aparat ugraÿen neispravan deo. Rešenje:

Oznaþimo sa A – dogaÿaj ugraÿeni deo je od kooperanta A; B – dogaÿaj ugraÿeni deo je od kooperanta B; 66

Poslovna statistika

C – dogaÿaj ugraÿeni deo je od kooperanta C; D – dogaÿaj ugraÿeni deo je od kooperanta D. N – ugraÿeni deo je neispravan. Sada je po uslovu zadatka P(A)=0.3 P(B)=0.2 P(C)=0.25 P(D)=0.25

P(N_A)=0.1 P(N_B)=0.15 P(N_C)=0.05 P(N_D)=0.08

pa je P(N)= P(A)˜P(N_A)+ P(B)˜P(N_B)+ P(C)˜P(N_C)+ P(D)˜P(N_D)= 0.3˜0.1+0.2˜0.15+0.25˜0.05+0.25˜0.08=0.0925. Verovatnoüa da je ugraÿeni deo neispravan je 0.0925.

9.

Bajesova formula. Ako H1, H2, ..., Hn þine potpun sistem hipoteza u odnosu na dogaÿaj A, i neka je P(A)z0, tada za  i=1, 2, ..., n važi

P(Hi~A)=

P( H i ) ˜ P(A _ H i ) P ( A)

P( H i ) ˜ P(A _ H i ) n

¦ P( H

j

.

) ˜ P(A _ H j )

j 1

Primer 2.2.2.6. Ako je u prethodnom, Primeru 2.2.2.5, uoþeno da je ugraÿen neispravan deo, kolika je verovatnoüa da taj neispravni deo potiþe od kooperanta B? Rešenje:

Po uslovu zadatka važi P(B~N)=

P( B) ˜ P(N _ B) P( N )

0.2 ˜ 0.15 | 0.32. 0.0925

Verovatnoüa da neispravni deo potiþe od kooperanta B je 0.32.

67

Poslovna statistika 2.2.3. Elementi kombinatorike

Prilikom odreÿivanja verovatnoüe klasiþnom definicijom potrebno je prebrojati dogaÿaje, pri þemu se þesto koristimo kombinatorikom. Sve kombinatorne formule mogu se izvesti iz dva osnovna pravila: pravila zbira i pravila proizvoda.

- Pravilo zbira. Ako se predmet jedne vrste može izabrati na n1 naþina, predmet druge vrste na n2 naþina, ..., predmet k-te vrste na nk naþina, onda se jedan predmet bez obzira na vrstu može izabrati na n1+n2+...+nk razliþitih naþina.

- Pravilo proizvoda. Ako se predmet jedne vrste može izabrati na n1 naþina, predmet druge vrste na n2 naþina, ..., predmet k-te vrste na nk naþina, onda se k predmeta razliþite vrste (odnosno iz svake vrste po jedan predmet) može izabrati na n1˜n2˜...˜nk razliþitih naþina. Primer 2.2.3. Na prvoj godini studija ima 250 devojaka i 220 muškaraca. Na koliko razliþitih naþina možemo izabrati jednog studenta sa ove godine, a na koliko razliþitin naþina možemo izabrati plesni par na ovoj godini? Rešenje:

Jednog studenta možemo izabrati na 250+220=470 razliþitih naþina. Jedan plesni par možemo izabrati na 250˜220=55 000 razliþitih naþina.

68

Poslovna statistika

2.2.3.1. Varijacije od n elemenata k-te klase

- Varijacije od n elemenata k-te klase bez ponavljanja Vnk (kx

 E ( X )@ ˜ pi konvergira, varijansa te 2

i

i 1

sluþajne promenljive postoji i jednaka je v

¦ >x

V 2 (X )

 E ( X )@ ˜ p i ; 2

i

i 1

v

ii)

ukoliko red

¦ >x

 E ( X )@ ˜ pi divergira, varijansa te sluþajne 2

i

i 1

promenljive ne postoji. Varijansa diskretne sluþajne promenljive još se naziva i centralni moment drugog reda. U opštem sluþaju, centralni moment k-tog reda diskretne sluþajne promenljive X oznaþavamo sa Mk(X) i nalazimo po formuli n

M k (X )

¦ >x

 E ( X )@ ˜ pi , k

i

i 1

90

Poslovna statistika

odnosno v

M k (X )

¦ >x

 E ( X )@ ˜ pi k

i

i 1

v

ukoliko red

¦ >x

 E ( X )@ ˜ pi konvergira. k

i

i 1

Iz same definicije varijanse jasno je da važi E > X  E ( X )@ . 2

V 2 (X )

Kako važi sledeüe: n

n

n

n

2 2 ¦ >xi  E ( X )@ ˜ pi ¦ xi2 ˜ pi  2 ˜ E ( X ) ˜ ¦ xi ˜ pi  >E ( X )@ ˜ ¦ pi

i 1

i 1

i 1

E ( X )  2 ˜ E ( X ) ˜ E ( X )  >E ( X )@

2

2

i 1

E ( X )  >E ( X )@

2

2

m2  m12

to varijansu možemo izraþunavati i pomoüu tzv. radne formule

V 2 (X )

E ( X 2 )  >E ( X )@

2

m2 ( X )  >m1 ( X )@ . 2

- Standardna devijacija. Standardnu devijaciju diskretne sluþajne promenljive X obeležavamo sa st. dev. (X) ili sa V(X) i izraþunavamo po formuli st.dev.( X )

var( X ) odnosno V ( X )

91

V 2 ( X ).

Poslovna statistika - Koeficijent varijacije. Koeficijent varijacije diskretne sluþajne promenljive X obeležavamo sa Cv(X) i izraþunavamo po formuli

Cv ( X )

V (X ) E( X )

.

Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izraþunavamo po formuli

C v ( X )%

V (X ) E( X )

˜ 100%.

92

Poslovna statistika 3.1.1.3. Parametri oblika rasporeda diskretne sluþajne promenljive

Parametri oblika rasporeda diskretne sluþajne promenljive su mera simetrije i mera spljoštenosti sluþajne promenljive. Mera simetrije se izražava pomoüu koeficijenta simetrije, dok se mera spljoštenosti izražava pomoüu koeficijenta spljoštenosti. I jedan i drugi koeficijent se izraþunavaju pomoüu centralnih momenata.

- Koeficijent simetrije sluþajne promenljive X oznaþavamo sa D3(X) i izraþunavamo po formuli:

M3(X )

D3 (X )

>V ( X )@3

.

Ukoliko je:

D3(X)=0

zakljuþujemo da je raspodela vrednosti obeležja simetriþna. Tada je takoÿe E ( X ) M e ( X ) M o ( X ) ;

D3(X)!0

zakljuþujemo da je raspodela vrednosti obeležja pozitivno asimetriþna (asimetrija udesno). Tada je takoÿe E( X ) ! M e ( X ) ! M o ( X ) ;

D3(X)0

zakljuþujemo da je raspodela vrednosti obeležja negativno asimetriþna (asimetrija ulevo). Tada je takoÿe E( X )  M e ( X )  M o ( X ) .

- Koeficijent spljoštenosti sluþajne promenljive X oznaþavamo sa D4(X) i izraþunavamo po formuli:

93

Poslovna statistika

M 4 (X )

D4 (X )

>V ( X )@4

.

Ukoliko je:

D4(X)=3

zakljuþujemo da je raspodela vrednosti obeležja normalno spljoštena;

D4(X)!3

zakljuþujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

D4(X)3

zakljuþujemo da raspodela vrednosti obeležja ima spljoštenost veüu od normalne.

Zadatak 3.1.1. Naüi varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti sluþajne promenljive „broj pojavljivanja „pisma” u bacanju tri novþiüa”.

94

Poslovna statistika 3.1.2. Primeri nekih raspodela diskretnih sluþajnih promenljivih 3.1.2.1. Binomna raspodela, B(n,p)

Zamislimo sledeüi statistiþki eksperiment: pretpostavimo da n-puta pokušavamo da realizujemo dogaÿaj A i da je verovatnoüa uspešne realizacije ovog dogaÿaja u svakom pokušaju ista i iznosi p. Naravno, tada je i verovatnoüa nerealizacije dogaÿaja A u svakom pokušaju ista i iznosi 1-p. Nad ovim eksperimentom definišimo sluþajnu promenljivu X kao „broj uspešnih realizacija dogaÿaja A u n pokušaja pri ovakvim uslovima”. Naÿimo raspodelu verovatnoüa ove sluþajne promenljive. Vrednosti koje ova sluþajna promenljiva X može uzeti su X X

i, i 0,1,2,..., n , gde je sa i oznaþeno da se dogaÿaj A realizovao taþno i puta u n pokušaja.

Varovatnoüu da se dogaÿaj A realizovao taþno i puta u n pokušaja, odnosno P ( X i ) , nalazimo sledeüim rasuÿivanjem: jedna od moguüih elemenatrnih realizacija ovog eksperimenta, kod koje se dogaÿaj A realizovao taþno i puta u n pokušaja, jeste da se dogaÿaj A realizovao u prvih i pokušaja, a nije realizovao u preostalih n-i pokušaja. Verovatnoüa ove elementarne realizacije je p ˜ p  p ˜ 1  p ˜ 1  p  1  p i

p i ˜ 1  p

n 1

.

n 1

§n· Postoji ¨¨ ¸¸ razliþitih elementarnih realizacija kod kojih se dogaÿaj A ©i ¹ realizovao taþno i puta u n pokušaja i svaka od njih ima istu verovatnoüu n i jednaku p i ˜ 1  p . Varovatnoüa da se dogaÿaj A realizovao taþno i puta u n pokušaja jednaka je zbiru verovatnoüa svih ovih elementarnih realizacija, odnosno 95

Poslovna statistika P( X

i)

§ n· i ¨¨ ¸¸ p ˜ (1  p) n  i , ©i ¹

i

0,1,2..., n.

Ovakva raspodela sluþajne promenljive se naziva Binomna raspodela. Kao što smo videli, zavisi od dva parametra: jedan je broj pokušaja realizacije dogaÿaja (n), a drugi je verovatnoüa uspešne realizacije dogaÿaja u svakom pojedinaþnom pokušaju (p). Kada sluþajna promenljiva X podleže zakonu Binomne raspodele sa parametrima n i p, to zapisujemo: X ~ B(n, p ). Dakle, važi: X ~ B ( n, p ) Ÿ P ( X

i)

§n· i ¨¨ ¸¸ p ˜ (1  p ) n i , ©i ¹

i

0,1,2..., n.

Parametri sluþajne promenljive X ~ B (n, p) : - matematiþko oþekivanje: - varijansa:

E( X ) n ˜ p ; V 2 ( X ) n ˜ p ˜ 1  p ;

- standardna devijacija

V (X )

- koeficijent simetrije

D3 (X )

- koeficijent spljoštenosti

D4 (X )

n ˜ p ˜ 1  p ; 1 2 ˜ p

; n ˜ p ˜ 1  p 6 1 3  . n n ˜ p ˜ 1  p

Primer 3.1.2.1. Strelac gaÿa u metu 10 puta. Verovatnoüa da pogodi metu je u svakom pokušaju ista i iznosi p=0.7. Naüi verovatnoüu da je pogodio taþno 8 puta.

96

Poslovna statistika Rešenje:

Sluþajna promenljiva X definisana kao „broj pogodaka u 10 pokušaja pri ovim uslovima”, podleže zakonu Binomne raspodele sa parametrima n=10 i p=0.7, §10 · X ~ B(10,0.7) , pa je P ( X 8) ¨¨ ¸¸ ˜ 0.7 8 ˜ 0.3 2 . ©8 ¹

3.1.2.2. Hipergeometrijska raspodela, H(N,N1,n)

Zamislimo sledeüi statistiþki eksperiment: proizvoljan skup sadrži N elemenata, od kojih N1 elemenata (N1max(0, n  N  N1 ), min(n, N1 )@. Ovakva raspodela sluþajne promenljive se naziva Hipergeometrijska raspodela. Kao što smo videli, zavisi od tri parametra: jedan je broj elemenata skupa iz kojeg vršimo sluþajan izbor bez ponavljanja (N), drugi je broj elemenata tog skupa koji ima željenu osobinu (N1), a treüi je broj elemenata koji izvlaþimo iz tog skupa bez ponavljanja (n). Kada sluþajna promenljiva X podleže zakonu Hipergeometrijske raspodele sa parametrima N, N1 i n, to zapisujemo: X ~ H ( N , N 1 , n). Parametri sluþajne promenljive X ~ H ( N , N 1 , n) : - matematiþko oþekivanje:

E( X )

- varijansa:

V 2 (X )

- standardna devijacija

V (X )

N1 ; N N § N · N n n ˜ 1 ˜ ¨1  1 ¸ ˜ ; N © N ¹ N 1





98

N1 § N1 · N  n ˜ ¨1  . ¸˜ N © N ¹ N 1

Poslovna statistika Primer 3.1.2.2. Iz odeljenja koje ima 30 uþenika od kojih su 18 deþaka, na sluþajan naþin biramo 10 uþenika. Naüi verovatnoüu da meÿu tih deset izabranih uþenika bude 7 deþaka.

Rešenje:

Broj deþaka u 10 sluþajno izabranih uþenika iz ovog odeljenja podleže raspodeli H (30,18,10) , pa je verovatnoüa da je meÿu tih 10 uþenika taþno 7 §18 · §12 · ¨¨ ¸¸ ˜ ¨¨ ¸¸ 7 3 deþaka jednaka © ¹ © ¹ . § 30 · ¨¨ ¸¸ ©10 ¹

99

Poslovna statistika 3.1.2.3. Puasonova raspodela, P(O)

Sluþajna promenljiva X ima Puasonovu raspodelu verovatnoüa, P(O), ukoliko je njena raspodela verovatnoüa odreÿena sledeüim zakonom raspodele: P( X

i)

e

O

˜

Oi i!

O

,

const ! 0, i

0,1,2,.....

Puasonova raspodela verovatnoüa je graniþni sluþaj Binomne raspodele u sluþaju kada je, za fiksirano i, nov i po 0, ali tako da je n˜p=const.>0. Naime, važi sledeüe: lim

n ov n˜ p O const ! 0

B ( n, p )

§n· i ¨¨ ¸¸ p ˜ 1  p n i n ov i O const ! 0© ¹ lim

n˜ p

n ˜ n  1 ˜  ˜ n  i  1 Oi § O · ˜ i ˜ ¨1  ¸ lim n ov i! n © n¹

n i

n

§ O· ¨1  ¸ i O § i 1· © n ¹ § 1· § 2· lim ˜ 1 ˜ ¨1  ¸ ˜ ¨1  ¸ ˜  ˜ ¨1  ¸˜ n ov i! n ¹ § O ·i © © n¹ © n¹ ¨1  ¸ © n¹ jer je § 1· § 2· § i 1· lim¨1  ¸ ˜ ¨1  ¸ ˜  ˜ ¨1  ¸ 1; n ov n ¹ © n¹ © n¹ © § O· lim¨1  ¸ n ov © n¹

Oi i!

§ O· lim¨1  ¸ n ov © n¹

˜ e O

P (O )

i

1

n

e O .

Iz ovoga zakljuþujemo da se Binomna raspodela može za veliko n i malo p, u sluþaju kada je n˜p=const., dosta dobro aproksimirati Puasonovom, koja je lakša za izraþunavanje. Greška koja se pri tome þini se veü za p50 može zanemariti. Kako je p blisko nuli, Puasonova raspodela opisuje dogaÿaje þija je verovatnoüa pojavljivanja veoma mala, odnosno tzv. retke dogaÿaje. Puasonova raspodela ne služi samo za aproksimaciju Binomne raspodele, veü i za odreÿivanje verovatnoüe broja javljanja nekog dogaÿaja u prostoru i

100

Poslovna statistika vremenu. Ovi dogaÿaji nisu dogaÿaji definisani kao podskup nekog statistiþkog eksperimenta, veü dogaÿaji koji zadovoljavaju sledeüe uslove: - broj javljanja dogaÿaja je nezavisan od jedne do druge jedinice vremena ili taþke prostora; - verovatnoüa istovremenog javljanja dva ili više dogaÿaja u sasvim malom vremenskom ili prostornom intervalu je zanemarljivo mala; - verovatnoüa javljanja dogaÿaja je proporcionalna dužini odreÿenog vremenskog ili prostornog intervala.

To su, na primer, dogaÿaji, broj telefonskih poziva u nekom vremenskom intervalu, broj þestica emitovanih od neke radioaktivne supstance, broj štamparskih grešaka po stranici neke knjige i sl. Naime, neka je sluþajna promenljiva Xt „broj pojavljivanja nekog dogaÿaja u t intervalu >0, t)”. Podelimo interval >0, t) na n intervala jednakih dužina . Ako n zamislimo da je n veliko, onda je: - broj javljanja dogaÿaja nezavistan od jednog do drugog intervala; - verovatnoüa istovremenog javljanja dva ili više dogaÿaja u jednom intervalu je zanemarljiva; - verovatnoüa da se u nekom intervalu ostvari jedan dogaÿaj, obeležimo je sa p, ista je za svaki interval i važi da kada nov tada po 0. Takoÿe, ta verovatnoüa je direktno proporcionalna dužini intervala, odnosno obrnuto

O

, O=const.!0, n gde parametar O na neki naþin karakteriše intenzitet protoka dogaÿaja.

proporcionalna broju intervala n, to jest možemo pisati p

Neka je Ai , i=1,2,...,n, dogaÿaj da se u i-tom intervalu pojavi posmatrani dogaÿaj. Tada su, na osnovu gore navedenog, dogaÿaji Ai , i = 1, 2, ..., n, nezavisni sa jednakim verovatnoüama 101

Poslovna statistika

P( Ai )

O

p

O

n

const. ! 0

i 1,2,..., n.

Sluþajna promenljiva Xt „broj pojavljivanja nekog dogaÿaja u intervalu >0, t)”, sada je identiþna sluþajnoj promenljivoj „broj realizacija dogaÿaja Ai , i = 1,2,...,n”, a ona, kao što znamo, pod ovim uslovima podleže zakonu Binomne, B(n,p), raspodele. Dakle, X t ~ B(n, p) . Ako poveüamo preciznost registrovanja dogaÿaja, to jest dozvolimo da nov, tada p Xt ~

O n

O

o 0 , ali p ˜ n

lim

n ov n˜ p O const .! 0

B(n, p )

const. ! 0 , pa tada važi

P(O ).

Puasonova raspodela zavisi samo od jednog parametra O, koji u sluþaju aproksimacije Binomne raspodele Puasonovom iznosi O=n˜p, a u sluþaju predstavljanja protoka nekog dogaÿaja u nekom prostornom ili vremenskom intervalu, predstavlja oþekivani broj pojavljivanja nekog dogaÿaja u tom posmatranom prostornom ili vremenskom intervalu.

Kada sluþajna promenljiva X podleže zakonu Puasonove raspodele sa parametrom O, to zapisujemo X ~ P(O ).

Parametri sluþajne promenljive X ~ P (O ) : - matematiþko oþekivanje: - varijansa:

E( X ) O ; V 2 (X ) O ;

- standardna devijacija

V (X )

- koeficijent simetrije

D3 (X )

- koeficijent spljoštenosti

D4 (X ) 3 

O ; 1

O

102

; 1

O

.

Poslovna statistika Primer 3.1.2.3.1. Verovatnoüa pogotka u cilj pri svakom gaÿanju je 0,05. Naüi verovatnoüu taþno jednog pogotka, ako je broj gaÿanja 60.

Rešenje:

Obeležimo sa X sluþajnu promenljivu broj pogotka u 60 gaÿanja. Pošto se binomna raspodela verovatnoüe za n ! 5 0 š p  0,1 može aproksimirati Puasonovom raspodelom u kojoj je O n ˜ p , to, kako je u ovom sluþaju n ˜ p 60 ˜ 0,05 3 , važi P( X

1)

31 e ˜ 1! 3

3 ˜ e 3 .

Primer 3.1.2.3.2. U telefonskoj centrali u toku jednog sata bilo je 60 poziva. Izraþunati verovatnoüu da u toku dva minuta nije bilo nijednog poziva.

Rešenje:

Obeležimo sa X sluþajnu promenljivu broj poziva u toku dva minuta. 60 2 , pa je verovatnoüa da Oþekivani broj poziva u toku dva minuta je O 30 u toku dva minuta nije bilo nijednog poziva jednaka P( X

0)

e 2 ˜

20 0!

e 2 .

103

Poslovna statistika 3.2.

Raspodele neprekidnih sluþajnih promenljivih

Ako je sluþajna promenljiva X neprekidna sluþajna promenljiva, onda ona može da uzme bilo koju vrednost iz nekog intervala vrednosti. Pošto u realnom intervalu ima beskonaþno mnogo vrednosti, besmisleno je govoriti o verovatnoüi da sluþajna promenljiva X uzme taþno odreÿenu vrednost u tom intervalu. U tom smislu, za neprekidnu sluþajnu promenljivu X možemo reüi da je verovatnoüa da ona uzme taþno odreÿenu vrednost, recimo i, jednaka nuli, to jest da je P ( X i ) 0 . Smisleno je i moguüe kod neprekidnih sluþajnih promenljivih izraþunati verovatnoüu da se sluþajna promenljiva X nalazi u nekom intervalu vrednosti, odnosno izraþunati P (a  X  b) . Kako je P( X

a)

P( X

b)

0,

to važi P ( a  X  b)

P ( a d X  b)

P (a  X d b)

P ( a d X d b) .

Važno je napomenuti da u sluþaju neprekidne sluþajne promenljive X, þinjenica da je P ( X i ) 0 ne znaþi da je dogaÿaj X = i nemoguü, veü da je besmisleno oþekivati ga unapred, odnosno da mu je a priori verovatnoüa jednaka nuli. Zato kod neprekidnih sluþajnih promenljiva nema smisla raþunati raspodelu verovatnoüa, veü je neprekidna sluþajna promenljiva potpuno definisana ako je data njena funkcija raspodele verovatnoüa ili njena funkcija gustine raspodele verovatnoüa.

104

Poslovna statistika - Funkcija raspodele verovatnoüa neprekidne sluþajne promenljive

Ako je X neprekidna sluþajna promenljiva, onda verovatnoüa da ta sluþajna promenljiva bude manja od neke realne vrednosti x, predstavlja vrednost funkcije raspodele verovatnoüa te sluþajne promenljive u taþki x i obeležava se sa F(x).

Dakle, funkcija raspodele verovatnoüa F(x), sluþajne promenljive X, jeste realna funkcija x  F (x) definisana sa:

F ( x)

P ( X  x),

 v x v .

Iz definicije funkcije raspodele F(x), zakljuþujemo da važi sledeüe:

1.

x  R

0 d F ( x) d 1

2.

a, b  R

a  b Ÿ F ( a ) d F (b )

3.

lim F ( x)

x o v

0

4.

P ( a  X  b)

5.

P( X ! a)

lim F ( x) 1 x ov

P ( a d X  b)

P ( a  X d b)

P ( a d X d b)

F (b )  F ( a )

P( X t a) 1  P( X  a) 1  P( X d a) 1  F ( a)

Primer izgleda jedne funkcije raspodele neprekidne sluþajne promenljive dat je na slici 3.2.1.

105

Poslovna statistika

F(x)

1

F(a)

a

x

Slika 3.2.1. Funkcija raspodele

Vrednost F(a) predstavlja verovatnoüu da sluþajna promenljiva uzme neku vrednost manju od a, odnosno F (a ) P( X  a ).

106

Poslovna statistika

- Funkcija gustine raspodele verovatnoüa neprekidne sluþajne promenljive

Neka je F funkcija raspodele neprekidne sluþajne promenljive X. Ako postoji nenegativna funkcija f definisana na R takva da za svako xR važi da je x

F ( x)

³ f (t ) ˜ dt ,

v

tada tu funkciju f nazivamo funkcija gustine verovatnoüe neprekidne sluþajne promenljive X, ili kraüe – funkcija gustine.

Iz definicije funkcije gustine raspodele f(x) zakljuþujemo da, ukoliko je F diferencijabilna u taþki x, važi sledeüe: F ' ( x) f ( x). Takoÿe važi:

1.

x  R

f ( x) t 0

2.

P ( a  X  b)

b

³ f ( x) ˜ dx

F (b)  F (a )

a

v

a

3.

P( X  a)

³ f ( x) ˜ dx

P( X ! a)

v

³ f ( x) ˜ dx a

v

4.

³ f ( x) ˜ dx

1

v

Primer izgleda jedne funkcije gustine raspodele neprekidne sluþajne promenljive dat je na Slici 3.2.2.

107

Poslovna statistika

f(x)

P(a0,1@¿

Rešenje:

Matematiþko oþekivanje je E( X )

v

1

³ x ˜ f ( x) ˜ dx.

³ x ˜ 2 xdx

v

0

110



x3 1 | 3 0

2 . 3

Poslovna statistika Modus iznosi Mo(X) = 1 jer samo za X=1 funkcija gustine verovatnoüa ima maksimum f (1) 2. Medijanu nalazimo iz uslova: Me

P( X  M e )

³ f ( x) ˜ dx

F (M e )

0.5 Ÿ

v Me

³ 2 x ˜ dx 0

x 2 Me 2˜ | 2 0

M e2

0.5 Ÿ M e

0.5

3.2.1.2. Parametri varijabiliteta neprekidne sluþajne promenljive

Parametri varijabiliteta neprekidne sluþajne promenljive koje üemo mi navesti su varijansa i standardna devijacija, kao apsolutne mere varijabiliteta neprekidne sluþajne promenljive, i koeficijent varijacije, kao relativna mera varijabiliteta neprekidne sluþajne promenljive. - Varijansa. Varijansu neprekidne sluþajne promenljive X obeležavamo sa var(X) ili V2(X), i odreÿujemo na sledeüi naþin:

ako neprekidna sluþajna promenljiva X ima funkciju gustine verovatnoüe f(x) onda je njena varijansa jednaka v 2

V (X )

³ >x  E ( X @

2

˜ f ( x) ˜ dx.

v

Varijansa se još naziva i centralni moment drugog reda. U opštem sluþaju centralni moment k-tog reda neprekidne sluþajne promenljive X oznaþavamo sa Mk(X) i nalazimo po formuli

111

Poslovna statistika v

³ >x  E ( X @

k

M k (X )

˜ f ( x) ˜ dx.

v

Iz same definicije varijanse jasno je da važi E > X  E ( X )@ . 2

V 2 (X )

Kako važi sledeüe: v

³ >x  E ( X @

2

˜ f ( x) ˜ dx

v

v

v

2 ³ x ˜ f ( x) ˜ dx  2 ˜ E ( X ) ˜ ³ x ˜ f ( x) ˜ dx  >E ( X )@ ˜ 2

v

v

E ( X )  2 ˜ E ( X ) ˜ E ( X )  >E ( X )@

2

2

v

³ f ( x) ˜ dx

v

E ( X )  >E ( X )@

2

2

m2  m12

to varijansu možemo izraþunavati i pomoüu tzv. radne formule

V 2 (X )

E ( X 2 )  >E ( X )@

2

m2 ( X )  >m1 ( X )@ . 2

- Standardna devijacija. Standardnu devijaciju neprekidne sluþajne promenljive X obeležavamo sa st. dev. (X) ili sa V(X) i izraþunavamo po formuli st.dev.( X )

var( X ) odnosno V ( X )

V 2 ( X ).

- Koeficijent varijacije. Koeficijent varijacije neprekidne sluþajne promenljive X obeležavamo sa Cv(X) i izraþunavamo po formuli

Cv ( X )

V (X ) E( X )

.

Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izraþunavamo po formuli

112

Poslovna statistika

C v ( X )%

V (X) E( X )

˜ 100% C v X ˜ 100% .

3.2.1.3. Parametri oblika rasporeda neprekidne sluþajne promenljive

Parametri oblika rasporeda neprekidne sluþajne promenljive su, kao i kod diskretnih, mera simetrije i mera spljoštenosti sluþajne promenljive. Mera simetrije izražava se pomoüu koeficijenta simetrije, dok se mera spljoštenosti izražava pomoüu koeficijenta spljoštenosti. I jedan i drugi koeficijent se izraþunavaju pomoüu centralnih momenata, na isti naþin kao i kod diskretnih sluþajnih promenljivih.

- Koeficijent simetrije sluþajne promenljive X oznaþavamo sa D3(X) i izraþunavamo po formuli:

M3(X )

D3 (X )

>V ( X )@3

.

Ukoliko je:

D3(X)=0

zakljuþujemo da je raspodela vrednosti obeležja simetriþna; tada je takoÿe E ( X ) M e ( X ) M o ( X ) ;

D3(X)!0

zakljuþujemo da je raspodela vrednosti obeležja pozitivno asimetriþna (asimetrija udesno), tada je takoÿe E( X ) ! M e ( X ) ! M o ( X ) ;

D3(X)0

zakljuþujemo da je raspodela vrednosti obeležja negativno asimetriþna (asimetrija ulevo); tada je takoÿe E( X )  M e ( X )  M o ( X ) . 113

Poslovna statistika

- Koeficijent spljoštenosti sluþajne promenljive X oznaþavamo sa D4(X) i izraþunavamo po formuli:

M 4 (X )

D4 (X )

>V ( X )@4

.

Ukoliko je:

D4(X)=3

zakljuþujemo da je raspodela vrednosti obeležja normalno spljoštena;

D4(X)!3

zakljuþujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

D4(X)3

zakljuþujemo da raspodela vrednosti obeležja ima spljoštenost veüu od normalne.

Zadatak 3.2.1. Naüi varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti neprekidne sluþajne promenljive þija je funkcija gustine

f ( x)

­2 ˜ x ® ¯0

x  >0,1@½ ¾. x  >0,1@¿

114

Poslovna statistika 3.2.2. Primeri nekih raspodela neprekidnih sluþajnih promenljivih 3.2.2.1. Normalna (Gausova) raspodela, N(P,V2)

Neprekidna sluþajna promenljiva X ima Normalnu raspodelu sa parametrima P i V2 ako je njena gustina raspodele verovatnoüa jednaka f ( x)

1

V ˜ 2S

e



( xP )2

x   v, v .

2V 2

Kada sluþajna promenljiva X ima Normalnu raspodelu sa parametrima P i V to zapisujemo X ~ N ( P , V 2 ) . 2

Normalnu raspodelu uveo je nemaþki matematiþar Karl Fridrih Gaus (1777-1855) u analizi ocene sluþajnih grešaka prilikom obrade rezultata merenja, pa se zato naziva i Gausova raspodela. Grafici gustina ove raspodele verovatnoüa zavise od parametara P i V2. Meÿutim, mogu se uoþiti sledeüe zajedniþke karakteristike:

-

sve krive gustine simetriþne su u odnosu na pravu x = P , što znaþi da je medijana Me=P ;

-

taþka maksimuma je taþka ( P ,

-

-

lim f ( x)

xorv

1

V ˜ 2S

0;

sve krive su zvonastog oblika;

115

) , pa je i moda Mo=P ;

Poslovna statistika -

ukoliko je V veüe, to je maksimalna vrednost gustine manja, ali je rasturanje oko prave x = P veüe, odnosno širina krive je veüa (Slika 3.2.3); N(2,22)

0.25 N(2,42)

dnormx (  2 2) dnormy (  2 4)

0.13

0

8

6

4

2 0

2

4

6

8 10 12

Slika 3.2.3. Funkcije gustine N(2,22) i N(2,42)

- promena vrednosti parametra P dovodi do translacije krive gustine duž x ose (Slika 3.2.4); N(2,22) N(6,22)

0.25

dnorm( x 2 2) dnorm( y  6 2)

0.13

0

4

2

0

2

4

6

8

10 12 14

x y

Slika 3.2.4. Funkcije gustine N(2,22) i N(6,22) 116

Poslovna statistika

- za sve sluþajne promenljive X ~ N ( P , V 2 ) važi P ( P  V  X  P  V ) | 0.68 P ( P  2V  X  P  2V ) | 0.95 P ( P  3V  X  P  3V ) | 0.997 -

ako sluþajna promenljiva X ima Normalan raspored, onda i njena linearna transformacija Y=a+bX takoÿe ima Normalan raspored;

-

ako je X 1 ~ N ( P1 , V 1 ) i X 2 ~ N ( P 2 , V 2 ) , tada

2

2

X 1  X 2 ~ N ( P1  P 2 , V 1 2  V 2 2 ) X 1  X 2 ~ N ( P1  P 2 , V 1 2  V 2 2 )

Sluþajnu promenljivu koja ima Normalnu raspodelu sa parametrima P=0 i V2=1 zovemo sluþajna promenljiva Z tipa ili Z promenljiva. Znaþi Z ~ N (0,1) (Slika 3.2.5).

0.5

dnorm( x 0  1) 0.25

0

4

3

2

1

0

1

2

x

Slika 3.2.5. Funkcija gustine N(0,1)

117

3

4

Poslovna statistika Pod brojem zD sluþajne promenljive Z tipa, podrazumevaüemo broj zD za koji zD

važi F ( zD )

1  D (Slika 3.2.6).

³ f ( x) ˜ dx

P ( Z  zD )

v

0.5 1-D D

dnorm( x 0  1) 0.25

0

x zD

Slika 3.2.6. Broj zD v

Oþigledno da je P ( Z ! zD )

³ f ( x) ˜ dx

D.

zD

Vrednosti Normalne raspodele N(0,1) date su tabliþno na kraju udžbenika u zD

obliku F ( zD )

P ( Z  zD )

³ f ( x) ˜ dx

1D .

v

U koloni oznaþenoj sa zD nalaze se cifra jedinica i prva decimala broja zD, dok se u vrsti oznaþenoj sa zD nalazi druga decimala broja zD. U preseku vrste odreÿene cifrom jedinicom i prvom decimalom broja zD i kolone odreÿene drugom decimalom broja zD, nalazi se vrednost 1-D koja odgovara tom zD. Tako, na primer, u preseku vrste odreÿene sa 0.7 i kolone odreÿene sa 0.04, nalazi se broj 0.7704, što znaþi da je P ( Z  0.74)

0.7704 ,

odnosno da je 118

0.74

z 0.2296 .

Poslovna statistika Bez dokaza üemo navesti jednu veoma važnu þinjenicu, koja nam omoguüava da tablicu vrednosti N(0,1) raspodele možemo koristiti za odreÿivanje vrednosti bilo koje N(P,V2) raspodele. Ta þinjenica je sledeüa: ako sluþajna promenljiva X ima N(P,V2) raspodelu, onda sluþajna promenljiva X P ima N(0,1) raspodelu, odnosno važi

V

X ~ N (P ,V 2 ) Ÿ

X P

V

~ N (0,1) to jest Z

X P

V

.

Primer 3.2.2.1. Ako sluþajna promenljiva X podleže zakonu N(20,102), naüi verovatnoüu P (5  X  28) . Rešenje:

Kako je u ovom sluþaju P

20 i V

X ~ N (20,10 2 ) Ÿ P(5  X  28) P(1.5  Z  0.8)

10 , to važi

X P

~ N (0,1) , pa je

V 5  20 X  P 28  20 P(   ) V 10 10

F (0.8)  F (1.5)

0.7881  0.0668

0.7213

Moivre-Laplaceova teorema (koju neüemo dokazivati) nam omoguüava da, u sluþajevima kada je n ˜ p ! 5 i n ˜ (1  p) ! 5 , Binomnu raspodelu B(n,p) možemo aproksimirati Normalnom raspodelom sa parametrima P n ˜ p i V 2 n ˜ p ˜ (1  p) , odnosno sa N (n ˜ p, n ˜ p ˜ (1  p)) .

Kako u tom sluþaju diskretnu raspodelu aproksimiramo neprekidnom, neophodno je da se interval integracije Normalne raspodele proširi i sa gornje i sa donje strane sa 0.5.

Primer 3.2.2.2. Ako je X ~ B(20,0.3) , naüi približno verovatnoüu P(3 d X d 7) .

119

Poslovna statistika Rešenje:

Kako je n ˜ p 20 ˜ 0.3 6 ! 5 i n ˜ 1  p 20 ˜ 0.7 14 ! 5 to B(20,0.3) možemo aproksimirati Normalnom raspodelom kod koje je

P

n˜ p

20 ˜ 0.3

n ˜ p ˜ 1  p 20 ˜ 0.3 ˜ 0.7

6 a V2

4.2 ,

pa je P (3 d X d 7) | P(

2.5  6

Z

7.5  6

) . 4.2 4.2 F (0.73)  F (1.71) 0.7673  0.0436 0.7237

Normalna raspodela ima najveüi znaþaj meÿu raspodelama verovatnoüa iz sledeüih razloga: - veliki broj sluþajnih promenljivih ima Normalan raspored; - veliki broj sluþajnih promenljivih ima aproksimativno Normalan raspored; - izvesne komplikovanije raspodele mogu se aproksimirati Normalnom raspodelom; - veliki broj sluþajnih promenljivih koje služe za verifikaciju statistiþkih testova imaju Normalnu raspodelu.

Parametri sluþajne promenljive X ~ N ( P , V 2 ) : - matematiþko oþekivanje: - varijansa: - standardna devijacija - koeficijent simetrije - koeficijent spljoštenosti

E( X ) V 2 (X ) V (X ) D3 (X ) D4 (X )

P ; V2 ; V ; 0 ; 3.

120

Poslovna statistika 3.2.2.2. Studentova raspodela (t-raspodela), tQ

Engleski matematiþar Goset (W. S. Gosset) je 1908. godine, pod pseudonimom Student, objavio rad u kome je definisao jednu novu, do tada nepoznatu neprekidnu raspodelu, koja je po njegovom pseudonimu i dobila naziv Studentova raspodela. Ova raspodela se naziva još i t-raspodela. Matematiþki izraz za funkciju gustine ove raspodele je previše komplikovan i neüemo ga izložiti. Studentova raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga üemo obeležavati sa Q i koji može iznositi Q =1, 2, 3, ... . Kada sluþajna promenljiva X ima Studentovu raspodelu sa Q stepeni slobode, to zapisujemo X ~ tQ . Studentova raspodela ima sledeüe osobine: - njena funkcija gustine raspodele, obeležimo je sa f(t), definisana je na þitavom skupu R za svako Q =1, 2, 3, ...; - grafik funkcije gustine raspodele je simetriþan u odnosu na ordinatnu osu, to jest f (t ) f (t ) t  R za svako Q =1, 2, 3, ...; - apscisna osa je asimptota krive gustine f(t), kada torv to jest lim f (t ) 0 za svako Q =1, 2, 3, ...; t orv

-

kada Qov Studentova raspodela teži N(0,1) raspodeli, tako da se veü za Q!30 Studentova raspodela može aproksimirati N(0,1) raspodelom;

-

funkcija gustine Studentove raspodele je na sredini više spljoštena, a na krajevima šira od N(0,1) rasporeda.

121

Poslovna statistika Na slici 3.2.7. dat je oblik funkcije gustine raspodele t1, t3 i t50. t50 t3 0.4

t1

dt ( x  1 ) dt ( y  3 ) dt ( z  50 )

0.2

0

4

3

2

1

0

1

2

3

4

x y  z

Slika 3.2.7. Funkcije gustine t1 , t3 , t50

Vrednosti Studentove raspodele tQ date su tabliþno na kraju udžbenika u obliku P (tQ ! tQ ,D ) D . U koloni oznaþenoj sa Stepeni slobode Q nalaze se cifre koje oznaþavaju broj stepeni slobode, odnosno parametar Q, dok se u vrsti oznaþenoj sa D nalaze vrednosti verovatnoüe. U preseku vrste odreÿene parametrom Q i kolone odreÿene verovatnoüom D, nalazi se broj tQ,D za koji važi P (tQ ! tQ ,D ) D . Tako, na primer, u preseku vrste odreÿene sa Q = 7 i kolone odreÿene sa D=0.05, nalazi se broj 1.8946, što znaþi da je P(t 7 ! 1.8946)

0.05 ,

odnosno da je 1.8946

t 7 ,0.05 (Slika 3.2.8).

122

Poslovna statistika

t7

0.4

dt ( x  7 )

D=0.05

0.2

0

4

3

2

1

0 x

1

2

3

t7,0.05=1.8946

Slika 3.2.8. Grafiþka predstava broja t7,0.05

Parametri sluþajne promenljive X ~ tQ : - matematiþko oþekivanje:

E( X )

- varijansa:

V 2 (X )

- standardna devijacija

V (X )

- koeficijent simetrije

D3 (X )

- koeficijent spljoštenosti

D4 (X ) 3 

0;

Q

;

Q 2 Q ; Q 2

Q ! 2; Q ! 2;

0;

123

6 ; Q 4

Q ! 4.

4

Poslovna statistika 3.2.2.3. Hi-kvadrat raspodela, FQ2

Matematiþki izraz za funkciju gustine ove raspodele takoÿe neüemo izložiti zbog njegove složenosti.

Hi-kvadrat raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga üemo obeležavati sa Q i koji može iznositi Q =1, 2, 3, ... Kada sluþajna promenljiva X ima Hi-kvadrat raspodelu sa Q stepeni slobode, to zapisujemo X ~ FQ2 . Hi-kvadrat raspodela ima sledeüe osobine:

- njena funkcija gustine raspodele, obeležimo je sa f(x), definisana je samo za pozitivne realne brojeve (x!0) za svako Q =1, 2, 3, ...; - grafik funkcije gustine raspodele je asimetriþan, i to pozitivno asimetriþan za svako Q =1, 2, 3, ...; - moda sluþajne promenljive sa FQ2 raspodelom iznosi Mo=Q - 2, (Q!2); - kada Qov , Hi-kvadrat raspodela teži Normalnoj raspodeli sa parametrima P = Q, i V2=2˜Q, tako da se veü za Q!30 Hi-kvadrat raspodela može aproksimirati N(Q,2˜Q) raspodelom.

Na slici 3.2.9. dat je oblik funkcije gustine raspodele F 12 , F 22 , F 32 , F 42 , F 72 .

124

Poslovna statistika

F 12 dchisq

( x  1 )

dchisq

( x  2 )

dchisq

( x  3 )

dchisq

( x  4 )

dchisq

( x  7 )

0.4

F 22 F 32 F 42

0.2

F 72

0

0 1

2

3

4

5

6

7 8

9 10 11 12 13 14 15

x

Slika 3.2.9. Funkcije gustine F 12 , F 22 , F 32 , F 42 , F 72

Vrednosti Hi-kvadrat raspodele FQ2 date su tabliþno na kraju udžbenika u obliku P ( FQ2 ! FQ2,D ) D . U koloni oznaþenoj sa Stepeni slobode Q nalaze se cifre koje oznaþavaju broj stepeni slobode, odnosno parametar Q, dok se u vrsti oznaþenoj sa D nalaze vrednosti verovatnoüe. U preseku vrste odreÿene parametrom Q i kolone odreÿene verovatnoüom D, nalazi se broj F2Q,D , za koji važi P ( FQ2 ! FQ2,D ) D . Tako, na primer, u preseku vrste odreÿene sa Q = 7 i kolone odreÿene sa D=0.05, nalazi se broj 14.067, što znaþi da je P ( F 72 ! 14.067)

0.05 ,

odnosno da je 14.067

F 72,0.05 (Slika 3.2.10).

125

Poslovna statistika

0.15

dchisq

( x  7 )

0.1

D=0.05 0.05

0

0

2

4

6

8

10 x

12

14

- matematiþko oþekivanje: - varijansa:

E( X ) Q ; V 2 ( X ) 2Q ;

- standardna devijacija

V (X )

- koeficijent simetrije

D3 (X )

- koeficijent spljoštenosti

D4 (X ) 3 

2Q ; 8

Q

126

; 12

Q

.

18

F27,0.05=14.067

Slika 3.2.10. Grafiþka predstava brojaF27,0.05

Parametri sluþajne promenljive X ~ FQ2 :

16

20

Poslovna statistika 3.3. Neke osobine matematiþkog oþekivanja E(X) i varijanse Var(X) sluþajne promenljive X

Neka su a,b,c proizvoljni realni brojevi i neka su X i Y sluþajne promenljive. Tada važi: 1. 2. 3.

E (c ) c Var (c) 0 E (aX  b)

4. 5.

Var (aX  b) a 2Var ( X ) E (aX  bY ) aE ( X )  bE (Y

6.

H ! 0

aE ( X )  b

P( X  E ( X ) t H ) d

Var ( X )

H2

.

Osobina pod brojem 6. je poznata i kao ýebiševljeva nejednakost.

127

Poslovna statistika 4. UZORAK I STATISTIKE UZORKA

Karakteristike populacije su egzaktno poznate samo ako su informacije o njima uzete iz þitave populacije. Meÿutim, anketiranje þitave populacije þesto stvara velike teškoüe i iziskuje mnogo vremena. U pojedinim sluþajevima je nemoguüe, pa i besmisleno anketirati þitavu populaciju ukoliko prikupljanje informacija znaþi i uništenje podataka. Zbog toga se kompletno anketiranje populacije þesto zamenjuje jednim drugim metodom analize parametara populacije – metodom uzorka. Uzorak je jedan deo populacije, izabran na specifiþan naþin, þijom analizom dobijamo rezultate pomoüu kojih možemo izvesti dovoljno valjane zakljuþke o vrednostima parametara þitave populacije. Radi što veüe verodostojnosti izvedenih zakljuþaka iz uzoraþkih podataka, potrebno je da uzorak bude reprezentativan, odnosno da je po svojoj strukturi sliþan osnovnom skupu. Prema naþinu izbora uzorka iz populacije, uzorke delimo u dve osnovne grupe: na sluþajne (probabilistiþke) i na namerne (neprobabilistiþke). Sluþajni uzorak je onaj uzorak kod koga je verovatnoüa izbora svakog elementa iz populacije u uzorak unapred poznata i razliþita od nule.

Svi ostali metodi izbora uzorka su nesluþajni i tako izabrani uzorci su namerni. Postoji više razliþitih naþina dobijanja sluþajnog uzorka iz populacije. Najznaþajniji meÿu nima je prost sluþajni uzorak i on je predmet analize ovog, 4. poglavlja. Pomenuüemo da u sluþajne uzorke spadaju još i stratifikovani uzorak, uzorak skupina, višeetapni uzorak, sistematski uzorak, ali njih neüemo analizirati u ovom udžbeniku.

128

Poslovna statistika 4.1. Prost sluþajni uzorak

Kao i u prethodnim poglavljima, broj þlanova populacije obeležavaüemo sa N, a broj þlanova uzorka sa n. Ako iz populacije veliþine N izvlaþimo uzorke od n elemenata tako da su verovatnoüe izbora svakog uzorka meÿusobno jednake, onda takav uzorak zovemo prost sluþajni uzorak. Mi üemo analizirati dve vrste prostog sluþajnog uzorka: prost sluþajni uzorak sa ponavljanjem i prost sluþajni uzorak bez ponavljanja. Prilikom uzimanja prostog sluþajnog uzorka sa ponavljanjem, element koji smo izabrali u uzorak vraüamo u populaciju pre izbora sledeüeg elementa i on ravnopravno uþestvuje u sledeüem izvlaþenju, odnosno isti element može biti izabran u uzorak više puta. Takoÿe, uzimaüemo u obzir i redosled izvlaþenja, što znaþi da uzorke sa istim elementima smatramo razliþitim ukoliko je redosled izbora elemenata razliþit. Imajuüi ovo u vidu, jasno je da postoji Nn razliþitih prostih sluþajnih uzorka sa ponavljanjem od n elemenata uzetih iz populacije od N elemenata. Birajuüi elemente sa ponavljanjem, svakom elementu skupa u svakom izboru 1 pružamo istu verovatnoüu da bude izabran, jednaku , tako da su u ovom N sluþaju izbori elemenata u uzorku statistiþki nezavisni dogaÿaji. Primer 4.1.1. Iz populacije þiji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke sa ponavljanjem od dva elementa. Rešenje:

Kako je N=5 i n=2, postoji 52=25 razliþitih uzorka sa ponavljanjem veliþine dva. To su:

1,1 2,1 3,1 4,1 5,1

(1,2)

(1,3)

(1,4)

(1,5)

(2,2)

(2,3)

(2,4)

(2,5)

(3,2)

(3,3)

(3,4)

(3,5)

(4,2)

(4,3)

(4,4)

(4,5)

(5,2)

(5,3)

(5,4)

(5,5)

129

Poslovna statistika Prilikom uzimanja prostog sluþajnog uzorka bez ponavljanja, element koji smo izabrali u uzorak ne vraüamo u populaciju pre izbora sledeüeg elementa i on ne uþestvuje u sledeüem izvlaþenju, odnosno isti element ne može biti izabran u uzorak više puta. Takoÿe, neüemo uzimati u obzir i redosled izvlaþenja, što znaþi da uzorke sa istim elementima smatramo istim i ukoliko je redosled §N· izbora elemenata razliþit. Imajuüi ovo u vidu, jasno je da postoji ¨¨ ¸¸ razliþitih ©n ¹ prostih sluþajnih uzorka bez ponavljanja od n elemenata uzetih iz populacije od N elemenata. Izbori elemenata u uzorku bez ponavljanja su statistiþki zavisni dogaÿaji jer su verovatnoüe izbora elemenata u razliþitim izvlaþenjima meÿusobno razliþite. 1 Naime, u prvom izvlaþenju verovatnoüa izbora nekog elementa u uzorak je , N 1 1 , u treüem , itd. u drugom N 1 N 2

Primer 4.1.2. Iz populacije þiji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke bez ponavljanja od dva elementa. Rešenje:

§5· Kako je N=5 i n=2, postoji ¨¨ ¸¸ © 2¹ veliþine dva. To su: (1,2)

(1,3) (2,3)

(1,4) (2,4) (3,4)

5˜ 4 2 ˜1

10 razliþitih uzorka bez ponavljanja

(1,5) (2,5) (3,5) (4,5)

130

Poslovna statistika U teorijskom sluþaju kada je veliþina populacije beskonaþna (Nov), iz nje možemo izabrati beskonaþno mnogo uzorka veliþine n. Tada pod prostim sluþajnim uzorkom podrazumevamo uzorak kod koga su izbori elemenata populacije u uzorak meÿusobno statistiþki nezavisni dogaÿaji. Zbog toga üemo smatrati da je prost sluþajni uzorak uzet iz beskonaþne populacije ekvivalentan prostom sluþajnom uzorku sa ponavljanjem uzetom iz konaþne populacije. U sluþajevima kad je uzorak dovoljno mali u odnosu na populaciju, n N (u n praksi nd0.05˜N, odnosno d 0.05 ), uzorak bez ponavljanja je N aproksimativno evivalentan uzorku sa ponavljanjem, jer se tada verovatnoüe izbora elemenata u uzorak bez ponavljanja neznatno razlikuju meÿusobno, pa ih možemo smatrati statistiþki nezavisnim dogaÿajima.

Neka je, na primer, N=1000 a n=50, tada je verovatnoüa izbora prvog elementa 1 u uzorak bez ponavljanja jednaka 0.001 , a verovatnoüa izbora 1000 1 | 0.001051 . poslednjeg, pedesetog elementa u uzorak jednaka 951 Verovatnoüe izbora svih ostalih elemenata nalaze se izmeÿu ovih dveju verovatnoüa i oþigledno je da se sve meÿusobno neznatno razlikuju. Dakle, analize i zakljuþci koje üemo izvesti za prost sluþajni uzorak sa ponavljanjem uzet iz konaþne populacije, važiüe za prost sluþajni uzorak uzet iz beskonaþne populacije, i aproksimativno üe važiti za prost sluþajni uzorak n bez ponavljanja uzet iz konaþne populacije u sluþajevima kada je d 0.05 . N Izbor elemenata iz populacije u prost sluþajni uzorak sa i bez ponavljanja u praksi se najþešüe sprovodi pomoüu Tablice sluþajnih brojeva, koja je data u Prilogu ovog udžbenika. Ova tablica formirana je od cifara 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, koje su radi veüe preglednosti svrstane u grupe od po pet redova i pet kolona, koje zanemarujemo prilikom korišüenja tablice. U sluþaju koji je ovde dat u Prilogu, Tablica sluþajnih brojeva ima ukupno 40 kolona i 100 vrsta. Algoritam po

131

Poslovna statistika kome je Tablica sluþajnih brojeva konstruisana obezbeÿuje da su verovatnoüe pojavljivanja bilo koje od ovih cifara iste i meÿusobno nezavisne. U sluþaju kada biramo sluþajni uzorak veliþine n iz populacije veliþine N, Tablicu sluþajnih brojeva koristimo na sledeüi naþin: -

-

-

prvo obeležimo sve þlanove populacije brojevima od 1 do N; ako prvi put koristimo Tablicu, sluþajno izaberemo jednu cifru u Tablici (recimo zažmurimo i pritisnemo olovkom); ako Tablicu ne koristimo prvi put, izaberemo onu cifru koja sledi posle poslednje korišüene cifre u prethodnom korišüenju Tablice; poþevši od te izabrane cifre, u proizvoljnom pravcu (recimo sleva nadesno) grupišemo ostale cifre koje slede u grupe od po onoliko cifara koliko cifara ima broj N; tako grupisane cifre sada þitamo kao brojeve i oni brojevi koji su u intervalu od 1 do N odreÿuju one elemente iz populacije koje uzimamo u uzorak; ako je uzorak bez ponavljanja, onda eventualno ponovljeni broj u intervalu od 1 do N odbacujemo, a u sluþaju uzorka sa ponavljanjem, uzimamo ga u uzorak.

Primer 4.1.3. Iz populacije koja ima N=50 elemenata izabrati prost sluþajni uzorak veliþine n=8 a) bez ponavljanja, b) sa ponavljanjem. Rešenje:

Obeležimo sve þlanove populacije brojevima 1 do 50. Neka je sluþajno izabrana cifra u Tablici sluþajnih brojeva, cifra koja se nalazi u šesnaestoj vrsti i prvoj koloni. Kako je N=50 dvocifren broj, grupisaüemo sve ostale cifre u smeru sleva na desno u brojeve od po dve cifre. Tako dobijamo 23 23 67 37 51 31 88 88 17 18 06 54 68 32 46 ... a) u sluþaju uzorka bez ponavljanja, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 37, 31, 17, 18, 06, 32, 46); b) u sluþaju uzorka sa ponavljanjem, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 23,37, 31, 17, 18, 06, 32). 132

Poslovna statistika 4.2. Raspodele parametara uzoraka

Neka odreÿeno obeležje u populaciji veliþine N ima sledeüe parametre: aritmetiþku sredinu koju obeležavamo sa P, varijansu koju obeležavamo sa V2 i proporciju koju obeležavamo sa S. Da se podsetimo, ukoliko elementi populacije imaju vrednosti obeležja N

x1 , x 2 ,..., x N onda je aritmetiþka sredina obeležja u toj populaciji P

¦x i 1

N

i

,

N

a varijansa V 2

¦ (x

i

 P)2

i 1

N

.

Takoÿe, to obeležje možemo posmatrati i kao sluþajnu promenljivu X, koja uzima vrednosti iz skupa x1 , x 2 ,..., x N , sa odreÿenim verovatnoüama, i za koju onda važi E ( X )

P , i var( X ) V 2 .

Sa proporcijom populacije S do sada se nismo susretali, i ona predstavlja verovatnoüu da odreÿeni þlan populacije ima odreÿenu osobinu (ili odreÿeno svojstvo). Odnosno, ako M þlanova populacije koja ima N þlanova, ima osobinu koje nas interesuje, onda je proporcija te osobine u ovoj populaciji M jednaka S . N Na primer, u populaciji od 150 osoba je 90 pušaþa, pa je proporcija broja 90 pušaþa u toj populaciji jednaka S 0.6 . 150 Nad ovom populacijom, kao što smo rekli, možemo izabrati Nn prostih §N· sluþajnih uzoraka veliþine n sa ponavljanjem i ¨¨ ¸¸ prostih sluþajnih uzoraka ©n ¹ veliþine n bez ponavljanja. U svakom od ovih uzoraka (recimo u i-tom uzorku þiji su elementi x1 , x 2 ,..., x n , od kojih mdn ima željenu osobinu) možemo izraþunati aritmetiþku sredinu itog uzorka, varijansu i-tog uzorka i proporciju željene osobine u i-tom uzorku na sledeüi naþin: 133

Poslovna statistika n

¦x

__

i 1

aritmetiþka sredina i-tog uzorka: x i

n

i

,

varijansa i-tog uzorka: ukoliko je aritmetiþka sredina populacije P poznata n

s i2

¦ (x

i

 P)2

i 1

,

n

ukoliko je aritmetiþka sredina populacije P nepoznata n

s c2,i

¦ (x

__

i

 x i )2

i 1

n 1

,

proporcija željene osobine u i-tom uzorku: pi

m . n

U skupu svih moguüih prostih sluþajnih uzoraka veliþine n sa i bez ponavljanja, vrednosti za aritmetiþku sredinu (varijansu i proporciju uzoraka) üe se pojavljivati sa odreÿenim verovatnoüama, jednakim koliþniku broja uzoraka koji imaju datu vrednost aritmetiþke sredine (varijanse i proporcije uzoraka) i broja svih moguüih uzoraka. To znaþi da nad skupom svih moguüih prostih sluþajnih uzoraka veliþine n možemo definisati sledeüe sluþajne promenljive: __

sluþajna promenljiva aritmetiþka sredina uzorka X : __

X

§ __ ¨ x1 ¨p © 1

__

__

__

x2



xi



p2



pi



gde je 134

· xr ¸ , p r ¸¹

Poslovna statistika __

broj uzoraka cija je aritmeticka sredina jednaka x i (uzorci sa pi Nn ponavljanjem);

__

broj uzoraka cija je aritmeticka sredina jednaka x i pi (uzorci bez §N· ¨¨ ¸¸ ©n ¹ ponavljanja);

sluþajna promenljiva varijansa uzorka: S 2 - ukoliko je aritmetiþka sredina populacije P poznata

S

2

§ s12 ¨ ¨p © 1

s 22



si2



p2



pi



s k2 · ¸ , p k ¸¹

gde je pi

pi

broj uzoraka cija je var ijansa jednaka s i2 (uzorci sa ponavljanjem); Nn

broj uzoraka cija je var ijansa jednaka s i2 (uzorci bez ponavljanja); §N· ¨¨ ¸¸ ©n ¹

135

Poslovna statistika S c2 - ukoliko je aritmetiþka sredina populacije P nepoznata S

2 c

§ s c2,1 ¨ ¨p © 1

s c2, 2



s c2,i



p2



pi



s c2,l · ¸, pl ¸¹

gde je pi

pi

broj uzoraka cija je var ijansa jednaka s c2,i Nn

broj uzoraka cija je var ijansa jednaka s c2,i §N· ¨¨ ¸¸ ©n ¹

(uzorci sa ponavljanjem);

(uzorci bez ponavljanja);

sluþajna promenljiva proporcija uzorka Pr: Pr

§ p1 ¨¨ © q1

p2



pi



q2



qi



ps · ¸, q s ¸¹

gde je qi

qi

broj uzoraka cija je proporcija jednaka pi (uzorci sa ponavljanjem); Nn

broj uzoraka cija je proporcija jednaka pi (uzorci bez ponavljanja). §N· ¨¨ ¸¸ ©n ¹

136

Poslovna statistika Primer 4.2.1. Za datu populaciju 1, 2, 3, 4, odrediti sve uzorke

a) sa ponavljanjem, b) bez ponavljanja, veliþine n=2 i prikazati raspodelu sluþajne promenljive aritmetiþka sredina __

uzorka X . Rešenje:

a) Broj uzoraka sa ponavljanjem veliþine n dobijenih iz populacije veliþine N iznosi N n . U našem sluþaju je n=2, N=4, pa je broj svih uzoraka sa ponavljanjem jednak 42=16. Ovi uzorci i njihove srednje vrednosti date su u Tabeli 4.2.1.a. Redni broj uzorka (i)

Uzorak

Srednja vrednost

Redni broj uzorka (i)

Uzorak

_

uzorka ( x i )

Srednja vrednost uzorka _

(xi ) 1 2 3 4 5 6 7 8

(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (2,4)

1 1,5 2 2,5 1,5 2 2,5 3

9 10 11 12 13 14 15 16

(3,1) (3,2) (3,3) (3,4) (4,1) (4,2) (4,3) (4,4)

2 2,5 3 3,5 2,5 3 3,5 4

Tabela 4.2.1.a. 

Sluþajna promenljiva aritmetiþka sredina uzorka sa ponavljanjem X ima sledeüu raspodelu verovatnoüa ­1 ° X :® 1 °¯16 

1,5 2 16

2 3 16

2,5 4 16

dobijenu iz tablice 4.2.1.a. 137

3 3 16

3,5 2 16

4 ½ ° 1¾, 16 °¿

Poslovna statistika b) Broj uzoraka bez ponavljanja veliþine n dobijenih iz populacije veliþine N §N· iznosi ¨¨ ¸¸ . U našem sluþaju je n=2, N=4, pa je broj svih uzoraka sa ©n ¹ § 4· ponavljanjem jednak ¨¨ ¸¸ © 2¹ Tabeli 4.2.1.b. Redni broj uzorka (i)

Uzorak

6. Ovi uzorci i njihove srednje vrednosti date su u

Srednja vrednost

Redni broj uzorka (i)

Uzorak

_

uzorka ( x i ) 1 2 3

(1,2) (1,3) (1,4)

Srednja vrednost uzorka _

1,5 2 2,5

4 5 6

(2,3) (2,4) (3,4)

(xi ) 2,5 3 3,5

Tabela 4.2.1.b. 

Sluþajna promanljiva aritmetiþka sredina uzorka bez ponavljanja X ima sledeüu raspodelu verovatnoüa ­1,5 ° X : ®1 °¯ 6 

2 1 6

2,5 2 6

3 1 6

3,5½ ° 1 ¾, 6 °¿

dobijenu iz tablice 4.2.1.b.

U nekim okolnostima raspodele ovih sluþajnih promenljivih, koje u stvari predstavljaju parametre uzorka, podležu zakonitostima koje smo obradili u poglavlju 3. ovog udžbenika. Odredimo te okolnosti i raspodele po kojima se tada ponašaju ovi parametri uzoraka.

138

Poslovna statistika __

4.2.1. Raspodela aritmetiþke sredine uzoraka X

__

__

Za matematiþko oþekivanje E ( X ) i varijansu var( X ) sluþajne promenljive __

aritmetiþka sredina uzorka X , formirane nad uzorcima veliþine n, iz populacije u kojoj je aritmetiþka sredina obeležja P i varijansa obeležja V2:

__

X

§ __ ¨ x1 ¨p © 1

__

__

__

x2



xi



p2



pi



· xr ¸ p r ¸¹

gde r predstavlja broj razliþitih aritmetiþkih sredina uzoraka iz skupa aritmetiþkih sredina svih uzoraka, važi sledeüe:

-

ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez ponavljanja n kod kojih je d 0.05 ) N N n __

__

E( X )

r

¦x

__

¦x ˜p i

i 1

i

i 1

i

Nn

P Nn

__

var( X )

r

i 1

-

__

¦ ( x i  P ) 2 ˜ pi

__

¦ ( x i  P)2

V2

Nn

n

i 1

ako su uzorci bez ponavljanja kod kojih je

139

n ! 0.05 N

Poslovna statistika §N· ¨n ¸ © ¹ __ __

E( X )

r

¦x

__

¦x ˜p i

i 1

i

i 1

i

P

§N· ¨¨ ¸¸ ©n ¹

§N· ¨n ¸ © ¹ __ r

__

¦(x

__

¦ ( x i  P ) 2 ˜ pi

var( X )

i

 P)2

V2 N n

i 1

§N· ¨¨ ¸¸ ©n ¹

i 1

n

˜

N 1

Primer 4.2.1.1. Pokazati da u Primeru 4.2.1. važi

§ ©

_

§ ©

_

§· a) da je E ¨ X ¸ © ¹

P i var¨ X ¸ V 2

§· b) da je E ¨ X ¸ © ¹

P i var¨ X ¸ V 2

· ¹

· ¹



X



X

V2 n

,

V2 N n n

˜

N 1

,

gde su P i V2 aritmetiþka sredina i varijansa populacije respektivno. Rešenje:

Srednja vrednost i varijansa populacije iznose

P V2

1 2  3  4 2,5 4 1  2,5 2  2  2,5 2  3  2,5 2  4  2,5 2 4

pa je imajuüi u vidu rezultate Primera 4.2.1.

140

5 , 4

Poslovna statistika a) 7



_

¦ xi ˜ pi

E( X )

i 1



1 2 3 4 3 2 1  1,5 ˜  2 ˜  2,5 ˜  3 ˜  3,5 ˜  4 ˜ 16 16 16 16 16 16 16

dakle 

P.

E( X )

2

§  2 · § §  ·· V  var( X ) E ¨¨ X ¸¸  ¨ E ¨ X ¸ ¸ X © ¹ © © ¹¹ 1 2 3 4  1,5 2 ˜  22 ˜  2 ,5 2 ˜  12 ˜ 16 16 16 16 3 2 1 5  32 ˜  3 ,5 2 ˜  42 ˜  2 ,5 2 16 16 16 8 

2

Kako je

V2

V

2 

X

5 4 5 4 2

i

n

2 to je

V2 n

141

2,5

Poslovna statistika b) 

E( X )

5

_

¦ xi ˜ pi i 1

1 1 2 1 1 1,5 ˜  2 ˜  2,5 ˜  3 ˜  3,5 ˜ 6 6 6 6 6

2,5

dakle 

E( X )

P. 2

 §  2· § · V  var( X ) E ¨¨ X ¸¸  ¨ E §¨ X ·¸ ¸ X © ¹ © © ¹¹ 1 1 2 1 1 1,5 2 ˜  2 2 ˜  2,5 2 ˜  3 2 ˜  3,5 2 ˜  2,5 2 6 6 6 6 6 odnosno 5 42 V2 N n . ˜ V 2 4 ˜ X 2 4 1 n N 1

2



5 12

__

Raspodela sluþajne promenljive aritmetiþka sredina uzorka X može se odrediti u zavisnosti od raspodele samog obeležja u populaciji na sledeüi naþin: i) ako posmatrano obeležje u populaciji ima N(P,V2) raspodelu, onda: - ako je V2 populacije poznato, - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ), ponavljanja kod kojih je N onda __

X ~ N (P ,

V2 n

), 142

Poslovna statistika - ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , N

onda __

X ~ N (P ,

V2 N n n

˜

N 1

);

- ako je V2 populacije nepoznato, - ako je P poznato, - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ) , ponavljanja kod kojih je N onda __

XP ~ tn ; S n - ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , N

onda __

XP N n ˜ N 1 n

S

~ tn ;

- ako je P nepoznato, - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ) , ponavljanja kod kojih je N onda

143

Poslovna statistika __

XP ~ t n 1 ; Sc n - ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , N

onda __

XP N n ˜ N 1 n

Sc

ii)

~ t n 1 ;

ako posmatrano obeležje u populaciji nema N(P,V2) raspodelu, onda aproksimativno važi:

- ako su uzorci sa ponavljanjem (ili Nov), uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veliþine nt30 i za njega važe svi rezultati kao i usluþaju kad obeležje u populaciji ima N(P,V2) raspodelu; - ako su uzorci bez ponavljanja, uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veliþine N , i za njega važe svi nt30 i populaciju za koju je n  2 rezultati kao i usluþaju kada obeležje u populaciji ima N(P,V2) raspodelu. Prisetimo se da za nt30 možemo raspodelu tn dovoljno dobro aproksimirati N(0,1) raspodelom. 144

Poslovna statistika Primer 4.2.1.2. a)

Pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatnoüu da üe proseþna težina 250 pakovanja ove robe biti manja od 49.95 kg.

b)

1000 pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatnoüu da üe proseþna težina sluþajno izabranih 250 od ovih 1000 pakovanja biti manja od 49.95 kg.

Rešenje:

Kako su podaci o proseþnoj težini P 50kg i standardnoj devijaciji 0.5kg odnose na beskonaþnu populaciju, i kako je veliþina uzorka

a)

V

_

n=250>30, to sluþajna promenljiva proseþna težina uzorka X ima približno

§ V2 N ¨¨ P , n ©

· ¸¸ raspodelu, pa važi: ¹

· §  ¸ ¨ X  P 49.95  50 ¸ § · ¨ P¨ X  49.95 ¸ P  ¸ ¨ V 0.5 © ¹ ¸ ¨ 250 ¹ © n P( Z  1,58) 1  F (1,58) 1  0,9429 _

0,0571

Kako su podaci o proseþnoj težini P 50kg i standardnoj devijaciji V 0.5kg odnose na konaþnu populaciju veliþine N=1000, i kako je veliþina n N 0,25 ! 0,05 i n 250  500 , to sluþajna uzorka n=250>30 i N 2

b)

_

promenljiva proseþna težina uzorka X ima približno § V 2 N n· ¸¸ raspodelu, pa važi: ˜ N ¨¨ P ,  1 n N © ¹ 145

Poslovna statistika

§_ · P¨ X  49.95 ¸ ¹ ©

§  ¨ 49.95  50 XP ¨  P¨ 0.5 1000  250 ¨¨ V ˜ N  n ˜ N 1 1000  1 250 © n

P( Z  1,82) 1  F (1,82) 1  0,9656

· ¸ ¸ ¸ ¸¸ ¹

0,0344

__

__

4.2.2. Raspodela razlike aritmetiþkih sredina uzoraka, X 1  X 2

Ukoliko uzimamo nezavisne uzorke veliþine n1 i n2 iz dve populacije, gde u prvoj populaciji obeležje X1 ima parametre E ( X 1 ) P1 i var( X 1 ) V 12 , a u drugoj populaciji obeležje X2 ima parametre E ( X 2 ) P 2 i var( X 2 ) V 22 , onda __

__

sluþajna promenljiva razlika aritmetiþkih sredina uzoraka, X 1  X 2 , ima __

__

__

parametre E ( X 1  X 2 )

__

P1  P 2 i var( X 1  X 2 )

V 12 n1



V 22 n2

Takoÿe važi: -

ako X 1 ~ N ( P1 , V 12 ) i X 2 ~ N ( P 2 , V 22 ) , onda __ __ § V2 V2 X 1  X 2 ~ N ¨¨ P1  P 2 , 1  2 n1 n2 ©

-

· ¸¸ ; ¹

ako ne znamo zakon raspodele obeležja X1 i X2 , onda aproksimativno važi: ako je

n1 t 30 i n2 t 30 , tada:

__ __ § V2 V2 · X 1  X 2 ~ N ¨¨ P1  P 2 , 1  2 ¸¸ . n1 n2 ¹ ©

146

.

Poslovna statistika Zadatak 4.2.2. Baterije iz fabrike A imaju srednje vreme trajanja 200 þasova i standardno odstupanje 30 þasova, dok iz fabrike B srednje vreme trajanja 180 þasova i standardno odstupanje 20 þasova. Ako izaberemo 250 baterija iz fabrike A i 200 baterija iz fabrike B, kolika je verovatnoüa da üe srednje vreme trajanja baterija iz fabrike A biti duže bar 25 þasova od srednjeg vremena trajanja baterija iz fabrike B?

4.2.3. Raspodela proporcije uzoraka Pr

Za matematiþko oþekivanje E ( Pr ) i varijansu var( Pr ) sluþajne promenljive proporcija uzorka Pr , formirane nad uzorcima veliþine n, iz populacije u kojoj je proporcija obeležja S:

Pr

§ p1 ¨¨ © q1

p2



pi



q2



qi



ps · ¸ , q s ¸¹

gde s predstavlja broj razliþitih proporcija uzoraka iz skupa proporcija svih uzoraka, važi sledeüe:

-

ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez ponavljanja n d 0.05 ): kod kojih je N Nn

s

E ( Pr )

¦ pi ˜ qi i 1

¦p

i

i 1

Nn

S Nn

s

var( Pr )

¦( p i 1

i

 S ) 2 ˜ qi

¦(p

i

 S )2

i 1

N

147

n

S ˜ 1  S n

Poslovna statistika

-

ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 : N

§N· ¨n ¸ © ¹ s

E ( Pr )

¦p

i

˜ qi

i 1

¦p

i

i 1

§N· ¨¨ ¸¸ ©n ¹

S

§N· ¨n ¸ © ¹ s

var( Pr )

¦( p

i

 S ) 2 ˜ qi

¦( p

i

 S )2

S ˜ 1  S N  n

i 1

§N· ¨¨ ¸¸ ©n ¹

i 1

n

˜

N 1

Ukoliko se radi o uzorcima sa ponavljanjem (ili Nov), onda sluþajna promenljiva proporcija uzorka Pr podleže zakonu binomne raspodele, a ukoliko se radi o uzorcima bez ponavljanja, onda sluþajna promenljiva proporcija uzorka Pr podleže zakonu hipergeometrijske raspodele, sa gore navedenim parametrima. Ukoliko je veliþina uzorka takva da je n ˜ S ! 5 i n ˜ 1  S ! 5 , tada aproksimativno važi sledeüe: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez ponavljanja n d 0.05 ), onda kod kojih je N Pr ~ N (S ,

S ˜ 1  S n

);

- ako su uzorci bez ponavljanja kod kojih je

Pr ~ N (S ,

S ˜ 1  S N  n n 148

˜

N 1

).

n ! 0.05 onda N

Poslovna statistika

Primer 4.2.3.1. a) Poznato je da je u zdravstvu 65% zaposlenih ženskog pola. Na sluþajan naþin je izabrano 50 osoba koje su zaposlene u zdravstvu. Kolika je verovatnoüa da je meÿu njima više od 35 žena? b) U grupi od 800 osoba zaposlenih u zdravstvu 520 su ženskog pola. Iz te grupe na sluþajan naþin je izabrano 50 osoba. Kolika je verovatnoüa da je meÿu njima više od 35 žena? Rešenje:

a) Kako se podatak o proporciji žena u zdravstvu S=0,65 odnosi na beskonaþnu populaciju, i kako je n ˜ S 50 ˜ 0,65 32.5 ! 5 i n ˜ 1  S 50 ˜ 0,35 17.5 ! 5 , to sluþajna promenljiva proporcija žena u § S ˜ 1  S · uzorku Pr ima približno N ¨ S , ¸ raspodelu, pa važi n © ¹

§ · 35 ¨  0,65 ¸ Pr  S 35 · § ¸ ! 50 P¨ Pr ! ¸ P¨ ¨ 50 ¹ 0,65 ˜ 0,35 ¸ S ˜ 1  S © ¨ ¸ n 50 © ¹ P Z ! 0,74 1  F (0,74) 1  0,7704 0,2296. 520 0,65 800 50 ˜ 0,65 32.5 ! 5 i

b) Kako se podatak o proporciji žena u zdravstvu S

odnosi na konaþnu populaciju N=800 i kako je n ˜ S n 50 n ˜ 1  S 50 ˜ 0,35 17.5 ! 5 i 0,0625 ! 0,05 to sluþajna N 800 promenljiva proporcija žena u uzorku Pr ima približno § S ˜ 1  S N  n · N ¨S , ˜ ¸ raspodelu, pa važi n N 1 ¹ ©

149

Poslovna statistika § 35 ¨  0,65 P  S 35 § · 50 r P¨ Pr ! ¸ P¨ ! ¨ S ˜ 1  S N  n 50 ¹ 0,65 ˜ 0,35 800  50 © ¨ ˜ ˜ n N 1 50 800  1 © P Z ! 0,76 1  F (0,76) 1  0,7764 0,2236.

· ¸ ¸ ¸ ¸ ¹

4.2.4. Raspodela varijanse uzoraka, S 2 -P poznato, S c2 -P nepoznato

Ukoliko se sluþajna promenljiva X u populaciji raspodeljuje po zakonu N(P,V2) onda u sluþaju kada je:

- P poznato

za sluþajnu promenljivu varijansa uzorka S 2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ), onda ponavljanja kod kojih je N n˜S2

V

2

~ F n2 ;

- ako su uzorci bez ponavljanja kod kojih je aproksimativno važi:

ako je nt30 i n  n˜S2

V2

N , tada 2

~ F n2 ;

150

n ! 0.05 , onda N

Poslovna statistika - P nepoznato

za sluþajnu promenljivu varijansa uzorka S c2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ), onda ponavljanja kod kojih je N (n  1) ˜ S c2

V

2

~ F n21 ;

-ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , onda N

aproksimativno važi:

ako je nt30 i n  (n  1) ˜ S c2

V

2

N , tada 2 ~ F n21 .

Zadatak 4.2.4. a) Iz populacije þiji su parametri P 150 i V 2 5 , uzet je prost sluþajni uzorak veliþine n=11. Kolika je verovatnoüa da je varijansa tog uzorka manja od 9? b) Iz populacije þiji je parametar V 2 50 , uzet je prost sluþajni uzorak veliþine n=11. Kolika je verovatnoüa da je varijansa tog uzorka manja od 20?

151

Poslovna statistika 5. STATISTIýKO OCENJIVANJE

Suština analize uzoraka neke populacije ogleda se upravo u tome da se iz što manje uzoraka (obiþno iz jednog) dobiju zadovoljavajuüe informacije o ponašanju obeležja u þitavoj populaciji. To ponašanje obeležja u þitavoj populaciji je zadovoljavajuüe opisano analizom uzorka, ukoliko su analizom tog uzorka dovoljno dobro procenjeni parametri populacije (aritmetiþka sredina, proporcija, varijansa) i ukoliko je dovoljno dobro procenjen zakon raspodele tog obeležja u populaciji. Analiza uzorka pomoüu koje se procenjuju parametri populacije naziva se parametarska analiza i ona üe u nekom obimu biti obraÿena u ovom udžbeniku. Analiza uzorka pomoüu koje se procenjuje zakon raspodele obeležja u populaciji naziva se neparametarska analiza i ona neüe biti obraÿena u ovom udžbeniku. Parametarska analiza se vrši na dva naþina, u zavisnosti od raspoloživih informacija o populaciji.

Prvi naþin, koji se zove statistiþko ocenjivanje, primenjuje se u sluþajevima kada parametri populacije nisu poznati, pa ih iz uzetog uzorka procenjujemo, odnosno ocenjujemo. Ovaj naþin üemo obraditi u ovom 5. poglavlju udžbenika. Drugi naþin, koji se zove testiranje parametarskih statistiþkih hipoteza, primenjuje se u sluþajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili i u kom smeru je promena išla, odnosno da li su se povaüali ili smanjili. Ovaj naþin üemo obraditi u 6. poglavlju ovog udžbenika. U postupku statistiþkog ocenjivanja zakljuþak o nepoznatoj vrednosti parametra populacije koji ocenjujemo možemo dati u vidu jedne brojne vrednosti i tada se ta ocena zove taþkasta ocena, ili u vidu intervala moguüih vrednosti i tada se ta ocena zove intervalna ocena.

152

Poslovna statistika 5.1 Taþkaste ocene

Obeležimo sa Q parametar populacije koji želimo da ocenimo (aritmetiþka sredina, proporcija, varijansa...) pomoüu neke taþkaste ocene dobijene iz prostog sluþajnog uzorka veliþine n. Neka je populacija okarakterisana sluþajnom promenljivom X koja uzima vrednosti iz skupa x1 , x 2 ,..., x N i neka je uzorak uzeo vrednosti x1 , x 2 ,..., x n . Obeležimo sa Un vrednost ocene parametra Q izraþunate iz uzorka þije su vrednosti x1 , x 2 ,..., x n . Oþigledno da üe vrednost ocene Un zavisiti od vrednosti x1 , x 2 ,..., x n , odnosno zavisiüe od izabranog uzorka. Dakle, na konkretnom uzorku þije su vrednosti x1 , x 2 ,..., x n , ocena Un je neka funkcija od x1 , x 2 ,..., x n , U n f ( x1 , x 2 ,..., x n ) . Ako bismo izvlaþili više uzoraka od n elemenata, elementi koji su prvi izvuþeni u svakom uzorku, a to su oni oznaþeni indeksom 1, u razliþitim uzorcima bi uzimali razliþite vrednosti sa razliþitim verovatnoüama, pa sve te vrednosti definišu jednu sluþajnu promenljivu koju üemo obeležiti sa X1. Sliþno, elementi koji su u više uzoraka izabrani na drugom mestu obrazuju sluþajnu promenljivu X2 itd. Na taj naþin ocena U je funkcija n-dimenzionalne sluþajne promenljive (X1, X2, ..., Xn), U = f(X1, X2, ..., Xn), pa i sama predstavlja sluþajnu promenljivu sa nekom svojom raspodelom verovatnoüa. Kako postoji beskonaþno veliki broj funkcija koje možemo definisati na promenljivima (X1, X2, ..., Xn), prirodno je definisati ocenu U na sledeüi naþin: ocenom parametra Q naziva se funkcija U=f(X1, X2, ..., Xn), koja sa verovatnoüom bliskom jedinici zadovoljava približnu jednakost U|Q kada je brojnost uzorka dovoljno velika, to jest ako važi lim P U  Q  C 1 , no N

n ov

gde je C odreÿena pozitivna konstanta.

Ova definicija dopušta da se na mnogo naþina definišu razne ocene za isti parametar Q. Na primer, aritmetiþku sredinu populacije možemo oceniti i aritmetiþkom sredinom, i medijanom, i modom, i geometrijskom sredinom uzorka, itd. Ali, neke od ovih ocena taþnije ocenjuju parametar populacije od 153

Poslovna statistika drugih. Oþigledno je da je ocena utoliko bolja ukoliko za manje vrednosti konstante C zadovoljava jednakost lim P U  Q  C 1 . no N

n ov

U cilju nalaženja najefikasnije ocene parametra populacije Q, neophodno je izvršiti sledeüu klasifikaciju ocena: - Saglasne (konzistentne) ocene. Saglasna (konzistentna) je ona ocena U=f(X1,X2,...,Xn) parametra populacije Q za koju važi H ! 0

lim P( U  Q  H ) 1 .

no N n ov

Odnosno, ocena je saglasna (konzistentna) ako konvergira u verovatnoüi ka parametru koga ocenjuje kada broj elemenata uzorka raste. - Centrirana (nepristrasna) ocena. Ocena U=f(X1,X2,...,Xn) parametra populacije Q je centrirana (saglasna) ako važi

E (U )

Q ,

to jest, ocena je centrirana (saglasna) ako je njeno matematiþko oþekivanje jednako parametru populacije koga ocenjuje.

- Najefikasnija ocena. Najefikasnija ocena je ona saglasna i centrirana ocena koja ima najmanju varijansu.

Donja granica varijansi svih moguüih ocena U parametra Q odreÿena je nejednakošüu Rao-Kramera, koju ovde neüemo navoditi.

Za primenu su, naravno, najpogodnije najefikasnije ocene, ali one ne postoje uvek. U sluþajevima kada ih nema treba ispitati da li postoje asimptotski nejefikasnije ocene.

- Asimptotski najefikasnija ocena. Ukoliko ocena U0 ima najmanju moguüu varijansu odreÿenu nejednakošüu Rao-Kramera, (a nije najefikasnija jer nije

154

Poslovna statistika saglasna ili centrirana), onda za ocenu U koja je saglasna i centrirana kažemo da je asimptotski najefikasnija ukoliko važi: var(U 0 ) n o N var(U ) n ov

1.

lim

Pokazuje se da važi sledeüe: 1. Najefikasnija ocena za aritmetiþku sredinu populacije P je aritmetiþka __

sredina uzorka X , þija je realizacija na uzorku x1 , x 2 ,..., x n jednaka n

__

x

¦x

i

i 1

.

n

2. Najefikasnija ocena za proporciju populacije S je proporcija uzorka Pr þija je realizacija na uzorku od n elemenata meÿu kojima je m sa m . osobinom þiju proporciju ocenjujemo jednaka p r n

3. Najefikasnija ocena za parametar O populacije u kojoj obeležje podleže Puasonovoj P(O) raspodeli je aritmetiþka sredina realizovanih vrednosti parametra Oi u uzorku. Dakle, ako ocenu parametra populacije O, oznaþimo sa Ooc, onda je na uzorku O1 , O2 ,..., On najefikasnija ocena n

Ooc

¦O i 1

n

i

.

4. Asimptotski najefikasnija ocena za varijansu populacije V2, þija je aritmetiþka sredina P-poznata je varijansa uzorka S2, þija je realizacija n

na uzorku x1 , x 2 ,..., x n jednaka s 2

155

¦ (x

i

 P)2

i 1

n

.

Poslovna statistika 5. Asimptotski najefikasnija ocena za varijansu populacije V2, þija je aritmetiþka sredina P-nepoznata, je varijansa uzorka Sc2, þija je n

realizacija na uzorku x1 , x 2 ,..., x n jednaka s c2

156

__

¦ ( xi  x ) 2 i 1

n 1

.

Poslovna statistika 5.2. Intervalne ocene

Intervalna ocena parametra populacije Q predstavlja interval vrednosti u kome sa odreÿenom verovatnoüom oþekujemo da se nalazi parametar populacije Q, i to takav interval da je verovatnoüa da je vrednost parametra Q veüa od gornje granice intervala, jednaka verovatnoüi da je vrednost parametra Q manja od donje granice intervala. Takav interval nazivamo simetriþan interval u pogledu verovatnoüe.

Taj interval vrednosti predstavlja interval oko neke fiksne vrednosti izraþunate iz konkretnog uzorka. Ta fiksna vrednost je obiþno taþkasta ocena parametra þiju intervalnu ocenu tražimo, odnosno parametra Q. Verovatnoüa da se parametar Q nalazi u tom intervalu iznosi 1-D i zovemo je koeficijent pouzdanosti intervalne ocene. Dakle, ako interval (a,b) predstavlja intervalnu ocenu za parametar Q sa koeficijentom pouzdanosti 1-D, to znaþi da važi sledeüe: P ( a  Q  b) 1  D P (Q  a )

P(Q ! b)

D 2

.

Oþigledno da poveüanje koeficijenta pouzdanosti poveüava širinu intervala, što sa svoje strane smanjuje preciznost, odnosno praktiþnu upotrebljivost ocene.

Intervalne ocene parametra Q iz uzorka odreÿujemo na osnovu zakonitosti po kojima se taþkasta ocena tog parametra U raspodeljuje u skupu svih moguüih uzorka tog tipa uzetih iz populacije sa parametrom Q. Zakone raspodele koji su nam potrebni u ovom delu, analizirali smo u poglavlju 4. ovog udžbenika.

157

Poslovna statistika 5.2.1. Intervalna ocena aritmetiþke sredine populacije, P

Kako je taþkasta ocena aritmetiþke sredine populacije P, aritmetiþka __

sredina uzorka X þija je raspodela data u 4. poglavlju, važi sledeüe:

j)

ako posmatrano obeležje u populaciji ima N(P,V2) raspodelu, onda: - ako je V2 populacije poznato: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci n d 0.05 ), bez ponavljanja kod kojih je N onda: __

X ~ N (P ,

V2 n

__

) odnosno

XP

V

~ N (0,1) ,

n pa važi videti Sliku 5.2.1.1.

0.5

1-D

D

dnorm( x 0  1) 0.25

2

0

x

 zD 2

zD 2

Slika 5.2.1.1. Funkcija raspodele N(0,1)

158

Poslovna statistika __

x P

P ( z D 

 zD ) 1  D Ÿ

V

2

2

n

V

__

P( x  z D ˜

n

2

__

 P  x  zD ˜

V n

2

) 1D

Dakle, pod ovim uslovima simetriþna intervalna ocena aritmetiþke sredine populacije sa koeficijentom pouzdanosti 1-D je:

V

__

P  ( x  zD ˜

n

2

V

__

, x  zD ˜

n

2

).

Pod ovim uslovima možemo unapred odrediti veliþinu uzorka n, pomoüu koga üemo dobiti interval ocene širine r L, sa nivoom pouzdanosti 1-D . Naime, važi

L

zD ˜

V

2

n

Ÿn

§ ¨ zD ¨ © 2

2

· ¸ ˜V 2 ¸ ¹ L2

- ako su uzorci bez ponavljanja kod kojih je n ! 0.05 , onda: N __

X ~ N (P ,

V2 N n n

˜

N 1

__

) odnosno

pa važi videti Sliku 5.2.1.1.

159

XP

V

N n ˜ N 1 n

~ N (0,1) ,

Poslovna statistika __

P( z D  2

__

P( x  z D ˜

x P

 zD ) 1  D Ÿ

V

N n ˜ N 1 n

V n

2

˜

2

__ V N n N n  P  x  zD ˜ ˜ ) 1D N 1 N 1 n 2

Dakle, pod ovim uslovima simetriþna intervalna ocena aritmetiþke sredine populacije sa koeficijentom pouzdanosti 1-D je: __

P  ( x  zD ˜ 2

V n

˜

V N  n __ N n , x  zD ˜ ). ˜ 1 N 1 N  n 2

- Ako je V2 populacije nepoznato: ako je P poznato, besmisleno je tražiti interval poverenja za P ; ako je P nepoznato, - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci n d 0.05 ), onda: bez ponavljanja kod kojih je N __

XP ~ t n 1 , pa važi videti Sliku 5.2.1.2. Sc n

160

Poslovna statistika

0.5

1-D

D

dnorm( x 0  1) 0.25

2

0

x

 t n 1, D

t

2

n 1,

D 2

Slika 5.2.1.2. Funkcija raspodele tn-1 __

P ( t

n 1,

x P  t D ) 1D Ÿ n 1, sc 2



D 2

n __

P( x  t

n 1,

D

__

sc

˜

n

2

 P  x t

n 1,

D

˜

2

sc n

) 1D

Dakle, pod ovim uslovima simetriþna intervalna ocena aritmetiþke sredine populacije sa koeficijentom pouzdanosti 1-D je: __

P (x t

n 1,

D 2

˜

sc n

__

, x t

n 1,

D 2

˜

sc n

).

- Ako su uzorci bez ponavljanja kod kojih je n ! 0.05 , onda : N

161

Poslovna statistika __

XP N n ˜ N 1 n

Sc

~ t n 1 , pa važi videti Sliku 5.2.1.2.

__

P ( t

n 1,

D

x P



N n ˜ N 1 n

sc

2

__

P( x  t

n 1,

D 2

˜

sc n

˜

t

n 1,

D

) 1D Ÿ

2

__ s N n N n  P  x t D ˜ c ˜ ) 1D n 1,  1 N 1 N n 2

Dakle, pod ovim uslovima, simetriþna intervalna ocena aritmetiþke sredine populacije sa koeficijentom pouzdanosti 1-D je: __ s s N  n __ N n P  (x t D ˜ c ˜ , x t D ˜ c ˜ ). n 1, n 1, N 1 N 1 n n 2 2

iii)

Ako posmatrano obeležje u populaciji nema N(P,V2) raspodelu, onda aproksimativno važi:

- ako su uzorci sa ponavljanjem (ili Nov), uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veliþine nt30 i za njega važe svi rezultati kao i usluþaju kada obeležje u populaciji ima N(P,V2) raspodelu; - ako su uzorci bez ponavljanja, uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veliþine 162

Poslovna statistika N , i za njega važe svi 2 rezultati kao i usluþaju kada obeležje u populaciji ima N(P,V2) raspodelu.

nt30 i populaciju za koju je n 

Primer 5.2.1. Poznato je da broj poena studenata na ispitu ima N(P,V2) raspodelu gde je parametar V nepoznat. Sluþajan uzorak od 20 studenata uzet iz ogromne populacije, ima na ovom ispitu srednji broj poena 70 i na njemu je izraþunata centrirana varijansa uzorka sc=10. Odrediti interval poverenja za srednji broj poena svih zadataka na ovom ispitu, ako je koeficijent pouzdanosti 1-D jednak: 1-D=0,99. Rešenje:

Kako broj poena ima normalnu raspodelu sa nepoznatom varijansom i kako je populacija ogromna, odnosno uzorak je manji od 5% populacije, to za proizvoljan koeficijent pouzdanosti 1-D važi: _ s s · §_ P¨¨ x  t n 1, D ˜ c  P  x  t n 1, D ˜ c ¸¸ 1  D gde vrednost t n 1, D þitamo iz 2 2 2 n n¹ © § · D Studentove t-tablice za n-1 stepeni slobode kao P¨¨ t n 1 ! t D ¸¸ . U ovom n 1, 2 2 ¹ © sluþaju broj stepeni slobode je 19.

Dakle, interval poverenja za srednji broj poena svih zadataka iznosi: za 1  D 70  2,86 ˜

0,99 Ÿ 10 20

D 2

0,005 Ÿ t19, 0,005

 P  70  2,86 ˜

10

odnosno 63.605  P  76.395 . 163

20

2,86 , pa je ,

Poslovna statistika 5.2.2. Intervalna ocena razlike aritmetiþkih sredina populacija, P1  P 2

Za nezavisne uzorke veliþine n1 i n2 iz dve populacije gde u prvoj populaciji obeležje X1 ima parametre E ( X 1 ) P1 i var( X 1 ) V 12 , a u drugoj populaciji obeležje X2 ima parametre E ( X 2 ) P 2 i var( X 2 ) V 22 , važi: ako X 1 ~ N ( P1 , V 12 ) i X 2 ~ N ( P 2 , V 22 )

-

onda: __ __ § V2 V2 · X 1  X 2 ~ N ¨¨ P1  P 2 , 1  2 ¸¸ , odnosno n1 n2 ¹ © __

__

X 1  X 2  ( P1  P 2 )

V 12 n1



__

P ( z D 

pa važi videti Sliku 5.2.1.1.

n2

__

x 1  x 2  ( P1  P 2 )

V 12

2

n1 __

~ N (0,1) ,

V 22

__

P( x 1  x 2  z D ˜ 2



V 12 n1

V 22

 zD ) 1  D Ÿ 2

n2 

V 22 n2

__

__

 P1  P 2  x 1  x 2  z D ˜ 2

V 12 n1



V 22 n2

) 1D

Dakle, pod ovim uslovima simetriþna intervalna ocena razlike aritmetiþkih sredina ovih populacija sa koeficijentom pouzdanosti 1-D je: __

__

P1  P 2  ( x 1  x 2  z D ˜ 2

V 12 n1



V 22 n2

__

__

, x 1  x 2  zD ˜

164

2

V 12 n1



V 22 n2

).

Poslovna statistika

Ako ne znamo zakon raspodele obeležja X1 i X2,

-

onda aproksimativno važi: n1 t 30 i n2 t 30, tada

ako je

§ V 12 V 22 · ¨ ¸¸ , pa i tada važi da je simetriþna  X 1  X 2 ~ N ¨ P1  P 2 , n n 1 2 ¹ © intervalna ocena razlike aritmetiþkih sredina ovih populacija sa koeficijentom pouzdanosti 1-D jednaka: __

__

__

__

P1  P 2  ( x 1  x 2  z D ˜ 2

V 12 n1



V 22 n2

__

__

, x 1  x 2  zD ˜

165

2

V 12 n1



V 22 n2

).

Poslovna statistika

Primer 5.2.2. Testira se uþinak novih lekova za spavanje pomoüu dve grupe bolesnika sliþnih karakteristika, tako što prva grupa od 50 bolesnika uzima ove lekove, dok ih druga grupa od 60 bolesnika ne uzima. Dužina spavanja bolesnika iz prve grupe je proseþno 8.2 þasova, a u drugoj 7.3 þasova. Zna se da standardna devijacija dužine spavanja prve grupe bolesnika iznosi V 1 0,30 þasova, dok je standardna devijacija druge grupe bolesnika V 2 0,40 þasova. Odrediti interval poverenja za razliku srednjih vrednosti dužina spavanja koju prouzrokuje uzimanje ispitivanih lekova, ako je koeficijent pouzdanosti 1-D jednak 0,95. Rešenje:

Kako n1>30 i n2>30, to za proizvoljan koeficijent pouzdanosti 1-D važi: _ _ §_ _ V 12 V 22 V 12 V 22 ·¸ ¨   P1  P 2  x 1  x 2  Z D ˜  1D P x1  x 2  Z D ˜ ¨ n1 n2 n1 n2 ¸¹ 2 2 ©

§ gde vrednost Z D þitamo iz tablice za N(0,1) raspodelu kao F ¨¨ Z D 2 © 2

· D ¸ 1 . ¸ 2 ¹

Dakle, interval poverenja za razliku srednjih vrednosti dužine spavanja iznosi: za 1  D 8.2  7.3  1,96 ˜

0,95 Ÿ

D 2

0,025 Ÿ Z D

F (0,975) 1,96 pa je

2

0,30 2 0,40 2 0,30 2 0,40 2   P1  P 2  8.2  7.37  1,96 ˜  50 60 50 60

odnosno 0.833  P1  P 2  0.967 , tj. sa verovatnoüom 0,95 smatramo da je novi lek produžio spavanje u proseku za 0.833 do 0.967 þasova.

166

Poslovna statistika

5.2.3. Intervalna ocena proporcije populacije S

Ukoliko su veliþina uzorka n i realizovana proporcija na uzorku pr takvi da je n ˜ p r ! 5 , n ˜ 1  p r ! 5 i n t 30 , tada aproksimativno važi sledeüe: -ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez ponavljanja n d 0.05 ), onda: kod kojih je N Pr ~ N (S ,

p r ˜ 1  p r ) n

odnosno

Pr  S p r ˜ 1  p r n

~ N (0,1) ,

pa važi videti Sliku 5.2.1.1. pr  S

P ( z D 

p r ˜ 1  p r n

2

P( p r  z D ˜ 2

 zD ) 1  D Ÿ 2

p r ˜ 1  p r  S  pr  z D ˜ n 2

p r ˜ 1  p r ) 1D n

Dakle, pod ovim uslovima, simetriþna intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1-D je:

S  ( pr  z D ˜ 2

p r ˜ 1  p r , pr  z D ˜ n 2

p r ˜ 1  p r ). n

Pod ovim uslovima možemo unapred odrediti veliþinu uzorka n, pomoüu koga üemo dobiti interval ocene proporcije, širine r L, sa nivoom pouzdanosti 1-D. Naime, važi:

167

Poslovna statistika

p r ˜ 1  p r Ÿn n

zD ˜

L

2

2

§ ¨ zD ¨ © 2

· ¸ ˜ p r ˜ (1  p r ) ¸ ¹ L2

, a kako je

2

p r ˜ 1  p r d

1 , 4

n

to je

§ · ¨ zD ¸ ¨ ¸ © 2¹ . 4 ˜ L2

- Ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , onda: N

p r ˜ 1  p r N  n ˜ ) , odnosno n N 1 Pr  S ~ N (0,1) , p r ˜ 1  p r N  n ˜ n N 1

Pr ~ N (S ,

pa važi videti Sliku 5.2.1.1.

pr  S

P( z D 

p r ˜ 1  p r N  n ˜ n N 1

2

 zD ) 1  D Ÿ 2

p r ˜ 1  p r N  n ˜  S  pr  z D ˜ n N 1 2

P( p r  z D ˜ 2

p r ˜ 1  p r N  n ) 1D ˜ n N 1

Dakle, pod ovim uslovima simetriþna intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1-D je:

S  ( pr  z D ˜ 2

p r ˜ 1  p r N  n ˜ , pr  z D ˜ n N 1 2

168

p r ˜ 1  p r N  n ˜ ). n N 1

Poslovna statistika

Zadatak 5.2.3. U uzorku od 80 bolesnika od tuberkoloze, uzetog iz skupa od 500 bolesnika, ima 52 pušaþa. Odrediti interval poverenja za broj pušaþa u ovom skupu od 300 obolelih, ako je koeficijent pouzdanosti 1-D jednak 0,90.

169

Poslovna statistika 5.2.4. Intervalna ocena varijanse populacije, V 2

Ukoliko se sluþajna promenljiva X u populaciji raspodeljuje po zakonu N(P,V2), onda u sluþaju kada je: - P poznato

za sluþajnu promenljivu varijansa uzorka S 2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n d 0.05 ), onda: ponavljanja kod kojih je N n˜S2

V

2

~ F n2 , pa važi videti Sliku 5.2.4.1.

0.15

dchisq

( x  D 7 )

0.1

D

2

2

1D

0.05

0

0

2

4

F

6

2

n ,1

D 2

8

10 x

12

F

14

16

2

n,

D 2

5.2.4.1. Funkcija raspodele F n2 170

18

20

Poslovna statistika

P( F 2

n ,1

P(

D

n˜S

F

n˜S2

2

V2

2

2

n,



V2 

D

 F 2D ) 1D Ÿ n,

n˜S

F2

n ,1

2

2

2

) 1D D 2

Dakle, pod ovim uslovima simetriþna intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-D je:

§ ¨n˜S2 n˜S2 V ¨ 2 , 2 ¨ F n ,D F n ,1 D 2 2 © 2

· ¸ ¸. ¸ ¹

- Ako su uzorci bez ponavljanja kod kojih je

n ! 0.05 , onda N

aproksimativno važi:

ako je nt30 i n 

N , tada 2

n˜S2

V2

~ F n2 , pa i tada važi da je

simetriþna intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-D jednaka: § ¨n˜S2 n˜S2 V 2 ¨ 2 , 2 ¨ F n ,D F n ,1 D 2 2 ©

171

· ¸ ¸. ¸ ¹

Poslovna statistika - P nepoznato

za sluþajnu promenljivu varijansa uzorka S c2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n ponavljanja kod kojih je d 0.05 ), onda: N (n  1) ˜ S c2

V

P( F 2

n 1,1

P(



D 2

(n  1) ˜ S

F2

n 1,

2 c

~ F n21 , pa važi videti Sliku 5.2.4.1.

2

(n  1) ˜ S c2

V

2

2

V 

D

 F2

n 1,

F2

) 1D Ÿ

2

(n  1) ˜ S c2 n 1,1

2

D

) 1D

D 2

Dakle, pod ovim uslovima simetriþna intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-D je:

§ ¨ (n  1) ˜ S 2 (n  1) ˜ S 2 c c V ¨ , 2 2 F ¨ F n 1,D D n 1,1 2 2 © 2

· ¸ ¸. ¸ ¹

- Ako su uzorci bez ponavljanja kod kojih je aproksimativno važi:

ako je nt30 i n  (n  1) ˜ S c2

V2

N , tada 2

~ F n21 , pa i tada važi da je 172

n ! 0.05 , onda N

Poslovna statistika

simetriþna intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-D jednaka: § ¨ (n  1) ˜ S 2 (n  1) ˜ S 2 c c V ¨ , 2 2 F F ¨ D D n 1, n 1,1 2 2 © 2

· ¸ ¸. ¸ ¹

Zadatak 5.2.4. Centrirana ocena varijanse nekog obeležja iz uzorka veliþine n=17, uzetog iz ogromne populacije u kojoj obeležje ima N(P,V2) raspodelu, 2

n

_ · § x x  ¸ ¨ i ¦ ¹ 625. Odrediti interval gde je P nepoznato, iznosi s c2 i 1 © n 1 poverenja za varijansu datog obeležja na þitavoj populaciji, ako je koeficijent pouzdanosti 1-D jednak 0,99.

173

Poslovna statistika 6. TESTIRANJE PARAMETARSKIH STATISTIýKIH HIPOTEZA

Kao što je veü reþeno, testiranje parametarskih statistiþkih hipoteza se primenjuje u sluþajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili, to jest u kom smeru je promena izvršena, odnosno da li su se poveüali ili smanjili. Obeležimo sa Q parametar populacije koji želimo da testiramo pomoüu neke informacije dobijene iz jednog prostog sluþajnog uzorka veliþine n. Ta informacija je obiþno taþkasta ocena parametra Q koja je izraþunata na tom jednom prostom sluþajnom uzorku veliþine n, a koju, kao što smo rekli u poglavlju 5, obeležavamo sa Un, U n f ( x1 , x 2 ,..., x n ) . Zakljuþak testiranja izvodimo na osnovu poznavanja zakona raspodele sluþajne promenljive U=f(X1,X2,...,Xn), koja je taþkasta ocena parametra Q (poglavlje 5) i njene vrednosti Un, U n f ( x1 , x 2 ,..., x n ) , konkretno realizovane na tom jednom prostom sluþajnom uzorku veliþine n. Postupak testiranja parametarskih statistiþkih hipoteza zapoþinjemo formiranjem nulte (obeležavaüemo je sa H0) i alternativne (obeležavaüemo je sa H1) hipoteze. Nulta i alternativna hipoteza predstavljaju dve pretpostavke o skupu vrednosti parametra populacije Q, koje su meÿu sobom disjunktne, a þija unija predstavlja skup svih moguüih vrednosti testiranog parametra Q. Nulta hipoteza H0 je pretpostavka o skupu vrednosti parametra Q koju želimo da osporimo. Alternativna hipoteza H1 je pretpostavka o skupu vrednosti parametra Q koju želimo da dokažemo.

Nulta i alternativna hipoteza javljaju se u sledeüa tri oblika:

174

Poslovna statistika 1. Dvosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q jednak nekoj hipotetiþkoj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q razliþit od te hipotetiþke (od ranije poznate) vrednosti Q0. H1:QzQ0

H0: Q=Q0

2. Desnostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q manji do jednak nekoj hipotetiþkoj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q veüi od te hipotetiþke (od ranije poznate) vrednosti Q0. H0: QdQ0

H1:Q!Q0

3. Levostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q veüi do jednak nekoj hipotetiþkoj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q manji od te hipotetiþke (od ranije poznate) vrednosti Q0. H0: QtQ0

H1:QQ0

Proces testiranja hipoteza, koji üemo kasnije objasniti, u svakom od ovih oblika üe nas navesti da odluþimo da: ili prihvatimo alternativnu hipotezu H1, ili ne prihvatimo alternativnu hipotezu H1. Prilikom donošenja te odluke, možemo napraviti dve vrste grešaka. Grešku I vrste üemo napraviti ako nas test navede da zakljuþimo da je hipoteza H1 istinita, a da je u stvarnosti hipoteza H1 neistinita. Grešku II vrste üemo napraviti ako nas test navede da zakljuþimo da je hipoteza H1 neistinita, a da je u stvarnosti hipoteza H1 istinita.

175

Poslovna statistika

Verovatnoüu da üemo naþiniti grešku I vrste obeležavamo sa D i nazivamo je nivo znaþajnosti testa. Dakle, važi:

D

P( H 1 prihvatimo | H 1 neistinita ) .

Verovatnoüu da üemo naþiniti grešku II vrste obeležavamo sa E i nazivamo je rizik greške II vrste. Dakle, važi:

E

P( H 1 ne prihvatimo | H 1 istinita ) .

Verovatnoüu da ne naþinimo grešku II vrste obeležavamo sa K i nazivamo je moü testa. Dakle, važi:

K 1 E

1  P( H 1 ne prihvatimo | H 1 istinita ) .

U praktiþnoj primeni nivo znaþajnosti testa, D, unapred biramo sa tendencijom da bude što manji, obiþno D=0.05 ili D=0.01, dok smanjenje rizika greške II vrste, E, odnosno poveüanje moüi testa K, ostvarujemo poveüanjem veliþine uzorka n.

Proces testiranja üemo ilustrovati na sledeüem pojednostavljenom primeru testiranja vrednosti aritmetiþke sredine populacije P, u kome unija nulte i alternativne hipoteze ne predstavlja skup svih moguüih vrednosti aritmetiþke sredine populacije, veü je, na primer:

H0: P=P0

H1:P=P1

Neka se vrednost datog obeležja raspodeljuje u populaciji po zakonu N(P,V2). Kao što smo ranije rekli, u tom sluþaju aritmetiþka sredina sluþajnog uzorka __

veliþine n, X , koja je taþkasta ocena aritmetiþke sredine populacije, P, 176

Poslovna statistika __

V2

) . U zavisnosti od toga da li je P=P0 n ili P=P1 , ta raspodela aritmetiþke sredine sluþajnog uzorka veliþine n üe, na primer za P1 ! P0 , izgledati kao na slici 6.1. raspodeljuje se po zakonu X ~ N ( P ,

N ( P1 ,

V2

)

dnorm

(nx  2  3 )

dnorm

( x2  10  3 )

N (P 0 ,

V

n

0.1

) 0

10

0 P 0

10 P

1

20

x

Slika 6.1. Primeri raspodele

Izaberimo jedan sluþajan uzorak veliþine n iz ove populacije, x1 , x 2 ,..., x n , i n

__

izraþunajmo njegovu aritmetiþku sredinu x

¦x

i

i 1

n

. __

Neka je D nivo znaþajnosti testa. Tada naÿimo vrednost x kr (kritiþnu vrednost aritmetiþke sredine uzorka), za koju važi da: __

ako je X ~ N ( P 0 ,

V2 n

__

__

) onda P ( X ! x kr ) D .

177

Poslovna statistika n

¦x

__

i 1

Tada, ako je izraþunata aritmetiþka sredina uzorka x __

__

n

i

veüa od kritiþne

__

vrednosti x kr , x ! x kr , odbacujemo nultu hipotezu H0:P=P0 i prihvatamo alternativnu hipotezu H1 :P=P1 , i pri tome smo možda pogrešili sa istom onom verovatnoüom sa kojom je moguüe izvuüi uzorak veliþine n te aritmetiþke sredine iz populacije koja se raspodeljuje po zakonu N(P0 ,V2), a ta je verovatnoüa, kao što smo videli, __

__

manja od D (jer je x ! x kr ). Odnosno, verovatnoüa da napravimo grešku I vrste je (u ovom sluþaju) manja od D. n

__

A ako je izraþunata aritmetiþka sredina uzorka x __

__

¦x i 1

n

i

manja do jednaka od

__

kritiþne vrednosti x kr , x d x kr , ne možemo prihvatiti alternativnu hipotezu H1 :P=P1 sa nivoom znaþajnosti D. __

Za ovako izabrano D, a samim tim i x kr , verovatnoüa da napravimo grešku II vrste, E, iznosi: __

ako je X ~ N ( P1 ,

V2 n

__

__

) onda P ( X  x kr )

E

jer je to verovatnoüa da iz populacije koja se raspodeljuje po zakonu __

__

N(P1 ,V2) izvuþemo uzorak þija je aritmetiþka sredina x  x kr , što üe nas naterati da ne prihvatimo alternativnu hipotezu H1 :P=P1 i time pogrešimo. __

Ilustracija za D, E, i x kr data je na Slici 6.2.

178

Poslovna statistika

N ( P1 ,

V2

dnormn

E )

(x 2  3)

dnorm 2 ( x  10  3 )

N (P 0 ,

V

n

D

0.1

) 0

10

0

__

P0

x

10

20

x kr P1 __

Slika 6.2. Ilustracija D,E, x kr

Oþigledno je (Slika 6.2) da za istu veliþinu uzorka n, smanjenje nivoa znaþajnosti testa D, dovodi do poveüanja rizika greške II vrste, E, odnosno do smanjenja moüi testa K. Smanjivanje parametra E postiže se smanjivanjem širina krivih na slici 6.2, odnosno smanjivanjem varijanse raspodele aritmetiþke sredine uzoraka. Kako je ta varijansa jednaka

V2 n

, smanjivanje

parametra E postiže se poveüanjem veliþine uzorka n. Naša dalja analiza odnosiüe se samo na testitranje parametarskih statistiþkih hipoteza za unapred izabrani nivo znaþajnosti testa D, dok se smanjivanjem rizika greške II vrste, E, poveüanjem veliþine uzorka, neüemo baviti. Zbog toga je važno imati na umu sledeüe: - ako nas test navede da prihvatimo alternativnu hipotezu H1 sa nivoom znaþajnosti testa D, to znaþi da hipotezi H1 možemo verovati sa verovatnoüom 1-D ; - ako nas test navede da ne prihvatimo alternativnu hipotezu H1 sa nivoom znaþajnosti testa D, to znaþi da hipotezi H1 ne možemo verovati sa verovatnoüom 1-D, a mera poverenja u nultu hipotezu H0 na osnovu ovog testa nam nije poznata.

179

Poslovna statistika Takoÿe, kada su nulta i alternativna hipoteza meÿu sobom disjunktne, a njihova unija predstavlja skup svih moguüih vrednosti testiranog parametra Q, možemo na osnovu uzorka odrediti nivo znaþajnosti sa kojim možemo prihvatiti alternativnu hipotezu H1. Naime, neka je, na primer, u pitanju desni jednosmerni test aritmetiþke sredine populacije P,obeležja þija se aritmetiþka sredina u uzorku veliþine n __

rasporedjuje po zakonu X ~ N ( P , H0:PdP0

V2 n

):

H1:P!P0.

Neka je iz te populacije uzet sluþajni uzorak veliþine n, i neka je njegova n

¦x

__

i

i 1

izraþunata aritmetiþka sredina jednaka x

n

.

Tada, tabliþnim rešavanjem jednaþine __

ako je X ~ N ( P 0 ,

V2 n

__

__

) onda P ( X ! x )

G,

po nepoznatom parametru G, možemo da konstatujemo da sa nivoom znaþajnosti G možemo prihvatiti alternativnu hipotezu H1:P!P0. U daljoj analizi koristiüemo zakone raspodele parametara uzoraka, analizirane u 4. poglavlju ovog udžbenika, odnosno zakone raspodele taþkastih ocena, analizirane u 5. poglavlju ovog udžbenika.

180

Poslovna statistika 6.1. Testiranje aritmetiþke sredine populacije, P

Neka je iz populacije þiju aritmetiþku sredinu P testiramo formiran jedan sluþajni uzorak veliþine n i neka je njegova aritmetiþka sredina jednaka n

__

x

¦x i 1

n

i

.

Za dati nivo znaþajnosti testa D, tada je: k) ako posmatrano obeležje u populaciji ima N(P,V2) raspodelu, onda:

- ako je V2 populacije poznato

- ako je uzorak sa ponavljanjem (ili Nov, ili uzorak n bez ponavljanja kod koga je d 0.05 ), onda je N __

X ~ N (P ,

V2 n

__

) odnosno

XP

V n

pa važi za:

181

~ N (0,1) ,

Poslovna statistika 1. dvosmerni test:

H0:P=P0

H1:PzP0

__

x  P0

V

! z D Ÿ prihvatamo H1:PzP0 sa nivoom 2

n znaþajnosti D (Slika 6.1.1); __

x  P0

V

d z D Ÿ ne prihvatamo H1:PzP0 sa nivoom 2

n znaþajnosti D (Slika 6.1.1);

0.5

D 2 dnorm( x 0  1) 0.25

D 2

0

x

 zD 2

zD 2

Slika 6.1.1. Funkcija raspodele N(0,1)

182

Poslovna statistika 2. desni jednosmerni test:

H0:PdP0

H1:P!P0

__

x  P0

V

! zD Ÿ prihvatamo H1:P! P0 sa nivoom

n znaþajnosti D (Slika 6.1.2); __

x  P0

V

d zD Ÿ ne prihvatamo H1:P! P0 sa nivoom

n znaþajnosti D (Slika 6.1.2);

0.5

D

dnorm( x 0  1) 0.25

0

x

zD

Slika 6.1.2. Funkcija raspodele N(0,1)

3. levi jednosmerni test:

H0:Pt P0

H1:PP0

__

x  P0

V

  zD Ÿ prihvatamo H1:P P0 sa nivoom

n znaþajnosti D (Slika 6.1.3); 183

Poslovna statistika __

x  P0

V

t  zD Ÿ ne prihvatamo H1:P P0 sa nivoom

n znaþajnosti D (Slika 6.1.3);

0.5

D dnorm( x 0  1) 0.25

0

x

 zD Slika 6.1.3.Funkcija raspodele N(0,1)

- ako je uzorak bez ponavljanja kod koga je onda je __

X ~ N (P ,

V2 N n n

˜

N 1

) , odnosno

__

XP

V

N n ˜ N 1 n

~ N (0,1) ,

pa važi za:

184

n ! 0.05 N

Poslovna statistika 1. dvosmerni test :

H0:P=P0

H1:PzP0

__

x  P0

! z D Ÿ prihvatamo H1:PzP0 sa nivoom N n 2 ˜ N  1 n znaþajnosti D (Slika 6.1.1);

V

__

x  P0

d z D Ÿ ne prihvatamo H1:PzP0 sa N n 2 ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.1);

V

2. desni jednosmerni test:

H0:PdP0

H1:P!P0

__

x  P0

! zD Ÿ prihvatamo H1:P! P0 sa nivoom N n ˜ N 1 n znaþajnosti D (Slika 6.1.2);

V

__

x  P0

d zD Ÿ ne prihvatamo H1:P! P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.2);

V

185

Poslovna statistika 3. levi jednosmerni test:

H0:Pt P0

H1:PP0

__

x  P0

  zD Ÿ prihvatamo H1:P P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.3);

V

__

x  P0

t  zD Ÿ ne prihvatamo H1:P P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.3);

V

- ako je V2 populacije nepoznato: - ako je P poznato besmisleno je testirati P ; - ako je P nepoznato: - ako je uzorak sa ponavljanjem (ili Nov, ili uzorak n bez ponavljanja kod koga je d 0.05 ) onda N __

XP ~ t n 1 , pa važi za: Sc n

186

Poslovna statistika 1. dvosmerni test:

H0:P=P0

H1:PzP0

__

x  P0 ! t D Ÿ prihvatamo H1:PzP0 sa nivoom n 1, sc 2 n znaþajnosti D (Slika 6.1.4); __

x  P0 d t D Ÿ ne prihvatamo H1:PzP0 sa nivoom n 1, sc 2 n znaþajnosti D (Slika 6.1.4);

0.5

D

D

dnorm( x 0  1) 0.25 2

2

0

 t n 1, D 2

x

t

n 1,

Slika 6.1.4. Funkcija raspodele tn-1

187

D 2

Poslovna statistika 2. desni jednosmerni test:

H0:PdP0

H1:P!P0

__

x  P0 ! t n 1,D Ÿ prihvatamo H1:P! P0 sa nivoom sc n znaþajnosti D (Slika 6.1.5); __

x  P0 d t n 1,D Ÿ ne prihvatamo H1:P! P0 sa nivoom sc n znaþajnosti D (Slika 6.1.5);

0.5

dnorm( x 0  1) 0.25

D

0

x

t n 1,D

Slika 6.1.5. Funkcija raspodele tn-1

188

Poslovna statistika 3. levi jednosmerni test:

H0:Pt P0

H1:PP0

__

x  P0  t n 1,D Ÿ prihvatamo H1:P P0 sa nivoom sc n znaþajnosti D (Slika 6.1.6); __

x  P0 t t n 1,D Ÿ ne prihvatamo H1:P P0 sa nivoom sc n znaþajnosti D (Slika 6.1.6);

0.5

dnorm( x 0  1) 0.25D

0

 t n 1, D

x

Slika 6.1.6. Funkcija raspodele tn-1

189

Poslovna statistika - ako je uzorak bez ponavljanja kod koga je n ! 0.05 , onda: N __

XP N n ˜ N 1 n

Sc

~ t n 1 , pa važi za:

1. dvosmerni test:

H0:P=P0

H1:PzP0

__

x  P0

! t D Ÿ prihvatamo H1:PzP0 sa n 1, N n 2 ˜ N  1 n nivoom znaþajnosti D (Slika 6.1.4); sc

__

x  P0

d t D Ÿ ne prihvatamo H1:PzP0 sa n 1, N n 2 ˜ N  1 n nivoom znaþajnosti D (Slika 6.1.4); sc

2. desni jednosmerni test:

H0:PdP0

H1:P!P0

__

x  P0

! t n 1,D Ÿ prihvatamo H1:P! P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.5); sc

190

Poslovna statistika __

x  P0

d t n 1,D Ÿ ne prihvatamo H1:P! P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.5); sc

3. levi jednosmerni test:

H0:Pt P0

H1:PP0

__

x  P0

 t n 1,D Ÿ prihvatamo H1:P P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.6); sc

__

x  P0

t t n 1,D Ÿ ne prihvatamo H1:P P0 sa N n ˜ N 1 n nivoom znaþajnosti D (Slika 6.1.6); sc

iv)

ako posmatrano obeležje u populaciji nema N(P,V2) raspodelu, onda aproksimativno važi:

- ako je uzorak sa ponavljanjem (ili Nov), uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veliþine nt30 i za njega važe svi rezultati kao i usluþaju kad obeležje u populaciji ima N(P,V2) raspodelu;

191

Poslovna statistika - ako je uzorak bez ponavljanja, uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veliþine N nt30 i populaciju za koju je n  , i za njega važe svi 2 rezultati kao i usluþaju kad obeležje u populaciji ima N(P,V2) raspodelu. Primer 6.1.1. Proseþan broj dnevnih posetilaca u beogradskim restoranima je 150 posetilaca po restoranu, sa standardnom varijansom V = 30. Posle smanjenja cena mesa u restoranima od 10%, uzorkovano je 40 sluþajno odabranih restorana, i na njima je izraþunat srednji broj dnevnih posetilaca – 160 posetilaca po rastoranu. i) Da li, sa nivoom znaþajnosti

a) b)

D=0,05 D=0,01

možemo konstatovati da se srednji broj posetilaca u restoranima poveüao? ii)

Sa kojim nivoom znaþajnosti možemo iz ovog uzorka konstatovati da se srednji broj posetilaca poveüao?

Rešenje:

Kako je uzorak n=40 > 30, to broj posetilaca možemo aproksimirati N(150, 302) raspodelom. Po uslovu zadatka, nulta hipoteza je H 0 : P d 150 , a alternativna H 1 : P ! 150. i) a) Za nivo znaþajnosti D

0,05 Ÿ Z D

važi:

192

1,64

Poslovna statistika

_

x P 0

160  150 30

V n

2,11 ! 1,64

40

Možemo konstatovati da se srednji broj posetilaca u restoranima poveüao. b) Za nivo znaþajnosti D

0,01 Ÿ Z D

2,33

važi: _

x P 0

V n

160  150 30

2,11  2,33

40

Ne možemo konstatovati da se srednji broj posetilaca u restoranima poveüao. ii) Iz uslova: _

x P 0

V

Z D Ÿ 2,11 Z D

n koristeüi N(0,1) tablicu, dobijamo 1  D 0,9826 , odakle je D=0,0174. Dakle, iz ovog uzorka možemo sa nivoom znaþajnosti D=0,0174 konstatovati da se srednji broj posetilaca poveüao.

193

Poslovna statistika

6.2. Testiranje razlike aritmetiþkih sredina populacija, P1  P 2

Neka su iz dve populacije þiju razliku aritmetiþkih sredina P1 - P2 testiramo formirana dva nezavisna uzorka veliþine n1 i n2, i neka su njihove aritmetiþke n1

__

sredine redom jednake x 1

¦ xi i 1

n2

__

¦x

i x2

n1

i 1

n2

i

.

Takoÿe, neka u prvoj populaciji obeležje X1 ima parametar var( X 1 ) V 12 , a u drugoj populaciji obeležje X2 ima parametar var( X 2 ) V 22 . Tada, za dati nivo znaþajnosti testa D, važi: ako X 1 ~ N ( P1 , V 12 ) i X 2 ~ N ( P 2 , V 22 ) ,

-

onda: __ __ § V2 V2 · X 1  X 2 ~ N ¨¨ P1  P 2 , 1  2 ¸¸ ,odnosno n1 n2 ¹ © __

__

X 1  X 2  ( P1  P 2 )

V 12 n1



V 22

pa važi:

n2

1. dvosmerni test:

__

~ N (0,1) ,

H0:P1 -P2 =P10 -P20

H1: P1 -P2 zP10 -P20

__

x 1  x 2  ( P10  P 20 )

V 12 n1



V 22

! z D Ÿ prihvatamo H1: P1 -P2 zP10 -P20 sa 2

n2

nivoom znaþajnosti D (Slika 6.1.1);

194

Poslovna statistika

__

__

x 1  x 2  ( P10  P 20 )

V

2 1

n1



V

2 2

d z D Ÿ ne prihvatamo H1: P1 -P2 zP10 -P20 sa 2

n2

nivoom znaþajnosti D (Slika 6.1.1);

2. desni jednosmerni test:

__

H0:P1 -P2 dP10 -P20

H1: P1 -P2 !P10 -P20

__

x 1  x 2  ( P10  P 20 )

V 12 n1



V 22

! zD Ÿ prihvatamo H1: P1 -P2 zP10 -P20 sa

n2

nivoom znaþajnosti D (Slika 6.1.2); __

__

x 1  x 2  ( P10  P 20 )

V 12 n1



V 22

d zD Ÿ ne prihvatamo H1: P1 -P2 zP10 -P20 sa

n2

nivoom znaþajnosti D (Slika 6.1.2);

3. levi jednosmerni test:

__

H0:P1 -P2 tP10 -P20

H1: P1 -P2 P10 -P20

__

x 1  x 2  ( P10  P 20 )

V 12 n1



V 22

  zD Ÿ prihvatamo H1: P1 -P2 zP10 -P20 sa

n2

nivoom znaþajnosti D (Slika 6.1.3);

195

Poslovna statistika __

__

x 1  x 2  ( P10  P 20 )

V

2 1

n1



V

2 2

t  zD Ÿ ne prihvatamo H1: P1 -P2 zP10 -P20 sa

n2

nivoom znaþajnosti D (Slika 6.1.3);

- ako ne znamo zakon raspodele obeležja X1 i X2 , onda aproksimativno važi:

ako je n1 t 30 i n2 t 30, tada

§ V 12 V 22 · ¨ ¸¸ ,  X 1  X 2 ~ N ¨ P1  P 2 , n n 1 2 ¹ © __

__

pa onda uzimamo uzorke veliþine n1 t 30 i n2 t 30 i za njih važi sve gore navedeno, kao da je X 1 ~ N ( P1 , V 12 ) i X 2 ~ N ( P 2 , V 22 ) .

Primer 6.2.1. Proizvoÿaþ A tvrdi da je proseþan radni vek sijalica koje on proizvodi veüi za 80 radnih þasova od radnog veka sijalica koje proizvodi proizvoÿaþ B. Standardne devijacije radnog veka sijalica proizvoÿaþa A i B su poznate i iznose V A 20 i V B 30 þasova. Uzorak od 50 sijalica proizvoÿaþa A ima srednji vek trajanja 2590 þasova, dok uzorak od 60 sijalica proizvoÿaþa B ima srednji vek trajanja 2500 þasova.

i) Da li, sa nivoom znaþajnosti a) b)

D=0,05 D=0,01

možemo konstatovati da je proizvoÿaþ A u pravu? ii) Sa kojim nivoom znaþajnosti možemo iz ovih uzoraka konstatovati da je proizvoÿaþ A u pravu?

196

Poslovna statistika Rešenje:

Po uslovu zadatka, nulta hipoteza je H 0 : P A  P B d 80 , a alternativna hipoteza je H 1 : P A  P B ! 80 . Kako je nA >30, nB >30, i varijanse obe populacije poznate, važi: i) a) Za nivo znaþajnosti D pa je _

0,05 Ÿ Z D

1,64 ,

_

x A  x B  P A  P B

V A2 nA



2590  2500  80

V B2

20 2 30 2  50 60

nB

2,08 ! 1,64 .

Možemo konstatovati da je proizvoÿaþ A u pravu.

b) Za nivo znaþajnosti D pa je _

0,01 Ÿ Z D

2,33 ,

_

x A  x B  P A  P B

V A2 nA



2590  2500  80

V B2

20 2 30 2  50 60

nB

2,08  2,33 .

Možemo konstatovati da proizvoÿaþ A nije u pravu.

197

Poslovna statistika

ii) Iz uslova:

_

_

x A  x B  P A  P B

V A2 nA



V B2

Z D Ÿ 2,08

ZD ,

nB

koristeüi N(0,1) tablicu, dobijamo 1  D

0,9812 , odakle je

D=0,0188. Dakle, iz ovih uzoraka možemo sa nivoom znaþajnosti D=0,0188 konstatovati da je proizvoÿaþ A u pravu.

198

Poslovna statistika

6.3. Testiranje proporcije populacije, S

Neka je iz populacije þiju proporciju S testiramo, formiran jedan sluþajni uzorak veliþine n i neka je njegova realizovana proporcija pr takva da je n ˜ p r ! 5 , n ˜ 1  p r ! 5 i n t 30 , tada za dati nivo znaþajnosti testa D aproksimativno važi sledeüe: - ako je uzorak sa ponavljanjem (ili Nov, ili uzorak bez ponavljanja n kod koga je d 0.05 ), onda N p r ˜ 1  p r ) n

odnosno

1. dvosmerni test:

H0:S =S0

Pr ~ N (S ,

Pr  S p r ˜ 1  p r n

~ N (0,1) ,

pa važi za: H1:S zS0

pr  S 0 ! z D Ÿ prihvatamo H1:S zS0 pr ˜ 1  pr 2 n sa nivoom znaþajnosti D (Slika 6.1.1);

pr  S 0

d z D Ÿ ne prihvatamo H1: S zS0 sa nivoom p r ˜ 1  p r 2 n znaþajnosti D (Slika 6.1.1);

199

Poslovna statistika

2. desni jednosmerni test:

H0:S dS0

H1:S! S0

pr  S 0

! zD Ÿ prihvatamo H1:S !S0 p r ˜ 1  p r n sa nivoom znaþajnosti D (Slika 6.1.2); pr  S 0

d zD Ÿ ne prihvatamo H1: S !S0 sa nivoom p r ˜ 1  p r n znaþajnosti D (Slika 6.1.2);

3. levi jednosmerni test:

H0:S tS0

H1:S S0

pr  S 0

  zD Ÿ prihvatamo H1:S S0 p r ˜ 1  p r n sa nivoom znaþajnosti D (Slika 6.1.3); pr  S 0

t  zD Ÿ ne prihvatamo H1: S S0 sa nivoom p r ˜ 1  p r n znaþajnosti D (Slika 6.1.3);

- ako su uzorci bez ponavljanja kod kojih je p r ˜ 1  p r N  n ) , odnosno ˜ n N 1 Pr  S ~ N (0,1) , p r ˜ 1  p r N  n ˜ n N 1

Pr ~ N (S ,

200

n ! 0.05 , onda N

Poslovna statistika

pa važi za: 1. dvosmerni test:

H0:S =S0

H1:S zS0

pr  S 0

! z D Ÿ prihvatamo H1:S zS0 p r ˜ 1  p r N  n 2 ˜ n N 1 sa nivoom znaþajnosti D (Slika 6.1.1);

pr  S 0

d z D Ÿ ne prihvatamo H1: S zS0 sa p r ˜ 1  p r N  n 2 ˜ n N 1 nivoom znaþajnosti D (Slika 6.1.1);

2. desni jednosmerni test:

H0:S dS0

H1:S! S0

pr  S 0

! zD Ÿ prihvatamo H1:S !S0 p r ˜ 1  p r N  n ˜ n N 1 sa nivoom znaþajnosti D (Slika 6.1.2); pr  S 0

d zD Ÿ ne prihvatamo H1: S !S0 sa p r ˜ 1  p r N  n ˜ n N 1 nivoom znaþajnosti D (Slika 6.1.2);

3. levi jednosmerni test:

pr  S 0 p r ˜ 1  p r N  n ˜ n N 1

H0:S tS0

H1:S S0

  zD Ÿ prihvatamo H1:S S0

201

Poslovna statistika sa nivoom znaþajnosti D (Slika 6.1.3),

pr  S 0

t  zD Ÿ ne prihvatamo H1: S S0 sa p r ˜ 1  p r N  n ˜ n N 1 nivoom znaþajnosti D (Slika 6.1.3).

Zadatak 6.3.1. Veruje se da üe 25% glasaþa iz jednog okruga glasati za stranku A na predstojeüim izborima. Sluþajan uzorak od 50 glasaþa iz tog okruga je pokazao da üe njih 7 glasati za stranku A.

i) Možemo li sa nivoom znaþajnosti a) b)

D=0,05 D=0,01

konstatovati da se u ovom okrugu promenio % glasaþa koji üe glasati za stranku A? ii) Sa kojim nivoom znaþajnosti možemo iz ovog uzorka konstatovati da se u ovom okrugu promenio % glasaþa koji üe glasati za stranku A?

202

Poslovna statistika

6.4. Testiranje varijanse populacije, V 2

Neka se sluþajna promenljiva X u populaciji raspodeljuje po zakonu N(P,V2). Neka je iz te populacije, þiju varijansu V2 testiramo, formiran jedan sluþajni uzorak veliþine n i neka je njegova centrirana varijansa jednaka: - ukoliko je aritmetiþka sredina populacije P poznata n

s2

¦ (x

i

 P)2

i 1

;

n

- ukoliko je aritmetiþka sredina populacije P nepoznata n

s c2

__

¦ ( xi  x ) 2 i 1

.

n 1

Tada važi: - P poznato

za sluþajnu promenljivu varijansa uzorka S 2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n ponavljanja kod kojih je d 0.05 ), onda: N n˜S2

V

2

~ F n2 , pa važi za:

1. dvosmerni test:

H 0 : V 2 =V 2 0

203

H1: V2 zV20

Poslovna statistika · · § n ˜ s2 § n ˜ s2 ¨ 2 ! F 2 D ¸ › ¨ 2  F 2 D ¸ Ÿ prihvatamo H1: V2 zV20 ¨ V ¨ V n, ¸ n ,1 ¸ 2 ¹ 2 ¹ © 0 © 0 sa nivoom znaþajnosti D (Slika 6.4.1);

F

2 n ,1

D

d

2

n ˜ s2

V

2 0

d F 2 D Ÿ ne prihvatamo H1: V2 zV20 n,

2

sa nivoom znaþajnosti D (Slika 6.4.1);

0.15

dchisq

( x  D 7 )

0.1

D

2

2 0.05

0

0

2

4

F

6

2 n ,1

D

8

10 x

2

12

F

14

16

18

2 n,

D 2

6.4.1. Funkcija raspodele F n2

2. desni jednosmerni test:

204

H0: V2 dV20

H1: V2 !V20

20

Poslovna statistika n ˜ s2

! F n2,D Ÿ prihvatamo H1: V2 !V20 sa nivoom znaþajnosti V 02 D (Slika 6.4.2);

n ˜ s2

V

2 0

d F n2,D Ÿ ne prihvatamo H1: V2 !V20 sa nivoom

znaþajnosti D (Slika 6.4.2);

0.15

dchisq

( x  7 )

0.1

D 0.05

0

0

2

4

6

8

10

F n2,D x

12

14

16

18

6.4.2. Funkcija raspodele F n2 3. levi jednosmerni test:

n ˜ s2

V 02

H0: V2 tV20

H1: V2 V20

 F n2,1D Ÿ prihvatamo H1: V2 V20 sa nivoom

znaþajnosti D (Slika 6.4.3);

205

20

Poslovna statistika n ˜ s2

V 02

t F n2,1D Ÿ ne prihvatamo H1: V2 V20 sa nivoom

znaþajnosti D (Slika 6.4.3);

0.15

dchisq

( x  7 )

0.1

D 0.05

0

0

2

4

F n2,1D

6

8

10

12

14

16

18

20

x

6.4.3. Funkcija raspodele F n2

- ako je uzorak bez ponavljanja kod koga je

n ! 0.05 , onda N

aproksimativno važi:

- ako je nt30 i n 

tada

n˜S2

V

2

N , 2

~ F n2 ,

pa i tada važi sve navedeno za uzorak sa ponavljanjem pod ovim uslovima;

206

Poslovna statistika -P nepoznato

za sluþajnu promenljivu varijansa uzorka S c2 važi: - ako su uzorci sa ponavljanjem (ili Nov, ili uzorci bez n ponavljanja kod kojih je d 0.05 ), onda: N (n  1) ˜ S c2 2

V

~ F n21 , pa važi za:

1. dvosmerni test:

H 0 : V 2 =V 2 0

H1: V2 zV20

· · § (n  1) ˜ s c2 § (n  1˜) s c2 2 2 ¸ Ÿ prihvatamo ¸›¨ ¨ F F  ! D D 2 2 ¨ V ¨ V n 1, ¸ n 1,1 ¸ 0 0 2 ¹ 2 ¹ © © 2 2 H1: V zV 0 sa nivoom znaþajnosti D (Slika 6.4.1);

F2

n 1,1

D

d

2

(n  1) ˜ s c2

V

2 0

d F2

n 1,

D

Ÿ ne prihvatamo H1: V2 zV20

2

sa nivoom znaþajnosti D (Slika 6.4.1);

2. desni jednosmerni test:

(n  1) ˜ s c2

V 02

H0: V2 dV20

H1: V2 !V20

! F n21,D Ÿ prihvatamo H1: V2 !V20 sa nivoom

znaþajnosti D (Slika 6.4.2);

(n  1) ˜ s c2

V

2 0

d F n21,D Ÿ ne prihvatamo H1: V2 !V20 sa nivoom

znaþajnosti D (Slika 6.4.2);

207

Poslovna statistika

3. levi jednosmerni test:

(n  1) ˜ s c2

V

2 0

H0: V2 tV20

H1: V2 V20

 F n21,1D Ÿ prihvatamo H1: V2 V20 sa nivoom

znaþajnosti D (Slika 6.4.3)

(n  1) ˜ s c2

V

2 0

t F n21,1D Ÿ ne prihvatamo H1: V2 V20 sa nivoom

znaþajnosti D (Slika 6.4.3);

- ako je uzorak bez ponavljanja kod koga je

n ! 0.05 , onda N

aproksimativno važi:

- ako je nt30 i n 

tada

(n  1) ˜ S c2

V

2

N , 2

~ F n21 ,

pa i tada važi sve navedeno za uzorak sa ponavljanjem pod ovim uslovima.

Zadatak 6.4.1. Sluþajan uzorak veliþine n=16 uzet je iz populacije u kojoj analizirano obeležje ima N(P,V2), gde je aritmetiþka sredina obeležja P

208

Poslovna statistika nepoznata, a smatra se da varijansa obeležja iznosi V 02 standardna devijacija ovog uzorka iznosi s c 33 . Da li, sa nivoom znaþajnosti a) b)

780. Centralizovana

D=0,05 D=0,01

možemo konstatovati da se promenila varijansa populacije?

209

Poslovna statistika 7. REGRESIJA I KORELACIJA

Vrlo þesto postoji potreba za predviÿanjem vrednosti nekog obeležja na osnovu njegove povezanosti sa jednim ili više drugih obeležja. Jedan od važnijih zadataka statistike je da utvrdi stepen i oblik zavisnosti izmeÿu odreÿenih obeležja od interesa, kod kojih egzaktan uzroþno-poslediþni odnos nije definisan. Takva analiza omoguüava predviÿanje vrednosti jednog obeležja na osnovu poznavanja vrednosti drugih obeležja, i þesto se koristi prilikom donošenja odreÿenih poslovnih odluka. Pod pojmom regresiona analiza podrazumeva se skup statistiþkih procedura za ispitivanje oblika zavisnosti izmeÿu dva ili više obeležja. Pod pojmom korelaciona analiza podrazumeva se skup statistiþkih procedura za ispitivanje stepena (jaþine) zavisnosti izmeÿu dva ili više obeležja. Ukoliko se ispituje oblik i stepen zavisnosti samo izmeÿu dva obeležja, onda se takav proces naziva prosta regresiona analiza (utvrÿivanje oblika zavisnosti dva obeležja) i prosta korelaciona analiza (utvrÿivanje stepena zavisnosti dva obeležja). Ukoliko se ispituje oblik i stepen zavisnosti izmeÿu više obeležja, onda se takav proces naziva višestruka regresiona analiza (utvrÿivanje oblika zavisnosti više obeležja), odnosno višestruka korelaciona analiza (utvrÿivanje stepena zavisnosti više obeležja). U ovom udžbeniku baviüemo se samo prostom regresionom i korelacionom analizom. Naša analiza üe se kao i do sada odvijati na podacima iz sluþajnog uzorka, a rezultati koje dobijemo važiüe za þitavu populaciju iz koje je uzet uzorak. Kod proste regresione analize neophodno je unapred odrediti koje obeležje üe imati ulogu nezavisne promenljive, a koje zavisne promenljive. Ovo se utvrÿuje na osnovu prethodnih teorijskih ili empirijskih saznanja o prirodi analiziranih obeležja. Tako, na primer, ako u jednoj populaciji želimo izvršiti prostu regresionu analizu (pronaüi zavisnost) izmeÿu meseþnog prihoda pojedinca i koliþini mesa utrošenog u ishrani pojedinca za mesec dana, logiþno 210

Poslovna statistika je da meseþni prihod bude nezavisna promenljiva, a koliþina utrošenog mesa zavisna.

Kod proste korelacione analize, svejedno je koje se obeležje karakteriše kao zavisno, a koje kao nezavisno.

Regresiona i korelaciona analiza se, kao što smo rekli, bave analizom zavisnosti meÿu obeležjima koja su stohastiþke prirode, pa rezultati koje dobijamo ovim analizama nisu egzaktni, veü su verodostojni sa odreÿenim verovatnoüama i u odreÿenim intervalima vrednosti. Ali, pomoüu njih mi možemo da ocenimo i predvidimo interval vrednosti zavisne promenljive za željene vrednosti nezavisne promenljive, sa unapred definisanom, zadovoljavajuüe velikom verovatnoüom.

Prvi korak u analizi zavisnosti dva obeležja je identifikovanje: koje obeležje predstavlja nezavisno, a koje zavisno obeležje. U daljoj analizi, nezavisno obeležje obeležavaüemo sa X, a zavisno sa Y. Na taj naþin, ukoliko uzimamo podatke o obeležjima X i Y iz sluþajnog uzorka veliþine n, dolazimo do n parova podataka (x1, y1), (x2, y2), ..., (xn, yn). Sledeüi korak je grafiþki prikaz ovih parova podataka koji se konstruiše u pravouglom Dekartovom koordinatnom sistemu, pri þemu se na apscisnu osu nanose podaci nezavisne promenljive X, a na ordinatnu osu vrednosti zavisne promenljive Y. Takav grafiþki prikaz naziva se dijagram raspršenosti, i na osnovu njega se na prvi pogled može dobiti odreÿena predstava o eventualnom postojanju zavisnosti, obliku zavisnosti i stepenu zavisnosti izmeÿu posmatranih obeležja (Slika 7.1).

211

Poslovna statistika Y

Y

X a)

X b)

Y

Y

X

X

c)

d) Slika 7.1. Dijagrami raspršenosti

Tako, na primer, sa Slike 7.1. možemo zakljuþiti da: a) postoji direktna linearna veza (zavisno obeležje linearno raste kada raste nezavisno obeležje); b) postoji inverzna linearna veza, slabija nego pod a. (zavisno obeležje linearno opada kada raste nezavisno obeležje); c) ne postoji stohastiþka veza; d) postoji snažna kvadratna veza. 212

Poslovna statistika Generalno, dijagramom raspršenosti možemo sagledati da li izmeÿu dva obeležja postoji stohastiþka veza ako postoji koji je oblik te veze (linearni, kvadratni, eksponecijalni, logaritamski...), i ako je oblik slaganja linearni, da li je direktni ili inverzni.

213

Poslovna statistika 7.1. Prosta linearna regresija i korelacija

Neka smo iz populacije veliþine N uzeli sluþajan uzorak veliþine n, i neka su na njemu uzeti parovi uzoraþkih podataka (xi,yi), i = 1, 2, ..., n za obeležja X i Y, þiju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.1, indicira da se radi o linearnoj zavisnosti obeležja X i Y u þitavoj populaciji, Y D  E ˜ X (opravdano pretpostavljena zavisnost obeležja X i Y u þitavoj populaciji). Zadatak linearne regresione analiza je da oceni koeficijente D i E , koji opisuju linearnu zavisnost u þitavoj populaciji, na osnovu uzoraþkih podataka (xi,yi), i = 1, 2, ..., n.

Y

y3

X

x3 Slika 7.1.1. Dijagram raspršenosti uzorka 214

Poslovna statistika Radi lakšeg objašnjenja, zamislimo da je dijagram raspršenosti þitave populacije, taþke (xi,yi), i = 1, 2, ..., N, dat na slici 7.1.2. Y

X Slika 7.1.2. Dijagram raspršenosti populacije Oþigledno da bi, i kada bi smo znali koeficijente D i E, zbog stohastiþnosti zavisnosti obeležja X i Y važilo: yi

D  E ˜ xi  H i ,

i = 1, 2, ..., N,

gde je sa Hi obeležen stohastiþki þlan (sluþajni poremeüaj) i-tog þlana populacije. Ovaj stohastiþki þlan, Hi , posledica je þinjenice da na zavisno obeležje Y ne deluje samo nezavisno obeležje X, veü i veliki broj drugih faktora koji u ovom modelu nisu uzeti u obzir. Ove fluktuacije Hi se u ovakvom pristupu karakterišu kao fluktuacije zavisne promenljive neobjašnjenje ovim regresionim modelom. 215

Poslovna statistika Dalja analiza koju üemo sprovesti, a pomoüu koje üemo iz uzoraþkih podataka (xi,yi), i = 1, 2, ..., n oceniti parametre D i E, podrazumevaüe da za stohastiþki þlan Hi u þitavoj populaciji (i = 1, 2, ..., N) važi sledeüe: - E (H i )

0 , što znaþi da je stohastiþki þlan u proseku u populaciji jednak nuli;

- Var (H 1 ) Var (H 2 )  Var (H N ) V 2 const , što znaþi da svi stohastiþki þlanovi imaju istu varijansu; ova osobina se još naziva i homoskedastiþnost; - izmeÿu bilo koja dva stohastiþka þlana Hi i Hj ne postoji nikakva funkcionalna veza; - Hi ima Normalan raspored, odnosno H i ~ N (0, V 2 ).

7.1.1. Ocenjivanje parametara D i E iz uzoraþkih podataka

Pod navedenim uslovima za stohastiþki þlan u populaciji, oceniüemo parametre D i E iz uzoraþkih podataka (xi,yi), i = 1 ,2, ..., n metodom minimiziranja sume svih kvadrata stohastiþkog þlana Hi , izraþunate na uzoraþkim podacima u odnosu na ocenjene vrednosti za D i E. Naime, neka je ocena parametra D, recimo koeficijent a, a ocena parametra E recimo koeficijent b. Tada je uzoraþka regresiona kriva, koju üemo obeležiti sa ^

y , jednaka: ^

y

a b˜ x ,

a za svaki par uzoraþkih podataka (xi,yi), i = 1, 2, ..., n važi sledeüe: yi

a  b ˜ xi  H i

^

yi

a  b ˜ xi .

Videti Sliku 7.1.3.

216

Poslovna statistika

Y

^

y

a b˜ x

^

yi

yi

xi X Slika 7.1.3. Uzoraþka regresiona kriva Koeficijente a i b, kao što smo rekli, dobiüemo minimiziranjem sledeüeg izraza: n

¦ H i2 i 1

n

^

¦ ( yi  y i ) 2 i 1

n

¦(y

i

 (a  b ˜ xi )) 2 .

i 1

Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a i b i njihovim izjednaþavanjem sa nulom:

217

Poslovna statistika ªn º w «¦ ( y i  (a  b ˜ xi )) 2 » ¬i 1 ¼ 0 wa , n ª º w «¦ ( y i  (a  b ˜ xi )) 2 » ¬i 1 ¼ 0 wb odakle dobijamo sledeüi sistem jednaþina: n

¦ yi i 1

n

n ˜ a  b ˜ ¦ xi i 1

n

¦x

n

i

.

n

a ˜ ¦ xi  b ˜ ¦ x

˜ yi

i 1

i 1

2 i

i 1

Ovaj sistem jednaþina ima jedinstveno rešenje po a i b:

b

n § n · § n · n ˜ ¦ x i ˜ y i  ¨ ¦ xi ¸ ˜ ¨ ¦ y i ¸ i 1 ©i1 ¹ ©i1 ¹

§ n · n ˜ ¦ xi2  ¨ ¦ xi ¸ i 1 ©i1 ¹ n

n

¦ yi a

2

i 1

n

n

b˜

¦x i 1

n

i

.

Ovako dobijene ocene za D i E su, pod gore navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi: E (a) D . E (b) E

7.1.2. Standardna greška regresije, se

Pomoüu ovako dobijenih a i b možemo oceniti varijansu stohastiþkih þlanova Hi, V2 sa s e2 , po formuli:

218

Poslovna statistika n

s e2

¦H

n

2 i

i 1

¦(y

n

^

i

 yi )2

i 1

n2

¦y 1 1

2 i

n

n

1 1

1 1

 a ˜ ¦ y i  b ˜ ¦ xi ˜ y i n2

n2

i dobiti standardnu grešku regresije, se , po formuli:

n

se

n

^

n

n

n

1 1

1 1

1 1

¦ H i2

¦ ( yi  y i ) 2

¦ yi2  a ˜ ¦ yi  b ˜ ¦ xi ˜ yi

n2

n2

n2

i 1

i 1

.

Standardna greška regresije je apsolutna mera varijacije uzoraþkih podataka od regresione linije uzorka. Što je standardna greška regresije veüa, to su taþke uzorka više raspršene od uzoraþke linije regresije, pa su i predviÿanja zasnovana na toj liniji regresije manje pouzdana. Takoÿe, što je uzorak veüi, to je standardna greška regresije manja.

7.1.3. Standardna greška ocene nagiba regresione krive, sb Standardnu grešku ocene nagiba regresione krive, sb , to jest standardnu grešku ocene parametra E, pomoüu na uzorku izraþunatog parametra b, dobijamo po formuli:

se

sb

n

§ · ¨ ¦ xi ¸ xi2  © i 1 ¹ ¦ n i 1

2

.

n

Da bi primena regresione linije uzorka bila opravdana, neophodno je ispitati da li uopšte postoji linearno slaganje u þitavoj populaciji, odnosno da li je parametar Ez0. To ispitivanje üemo izvršiti dvosmernim testom hipoteza, gde H0: E=0, a alternativna H1:Ez0. je nulta hipoteza Ovim testom prihvatiüemo alternativnu hipotezu H1:Ez0 sa nivoom znaþajnosti D (ovo D predstavlja verovatnoüu da üemo naþiniti grešku I vrste i nema 219

Poslovna statistika nikakve veze sa parametrom D iz regresione jednaþine populacije Y D  E ˜ X ), ukoliko je b !t D . n  2, sb 2

7.1.4. Koeficijent determinacije, r2

Relativna mera reprezentativnosti regresione linije koja pokazuje koji se deo varijabiliteta obeležja Y objašnjava promenom obeležja X po linearnom regresionom modelu, zove se koeficijent determinacije, r2, i na uzorku se izraþunava po formuli:

r2

§ n § n · § n · ¨ ˜ ˜  n x y ¨ ¦ xi ¸ ˜ ¨ ¦ y i ¸ ¦ i i ¨ i 1 ©i1 ¹ ©i1 ¹ ¨ 2 2 n n ¨ § n · § n · ¨ n ˜ ¦ xi2  ¨ ¦ xi ¸ ˜ n ˜ ¦ y i2  ¨ ¦ y i ¸ ¨ i 1 i 1 ©i1 ¹ ©i1 ¹ ©

2

· ¸ ¸ ¸ . ¸ ¸ ¸ ¹

Vrednost koeficijenta determinacije varira od 0 do 1, to jest važi: 0 d r 2 d 1. Što je koeficijent determinacije bliži jedinici, to regresiona kriva bolje opisuje zavisnost podataka. Tako, ako je na primer: r2

0.92 ,

to znaþi da je 92% ukupnog varijabiliteta zavisne promenljive opisano varijabilitetom nezavisne promenljive po utvrÿenom regresionom zakonu, a da samo 8% varijabiliteta nije objašnjeno regresionom linijom, veü je uzrokovano nekim neidentifikovanim faktorima.

220

Poslovna statistika 7.1.5. Koeficijent proste linearne korelacije u uzorku, r

Sa koeficijentom determinacije je usko povezan koeficijent proste linearne korelacije u uzorku, r, koji na uzorku izraþunavamo po formuli:

n § n · § n · n ˜ ¦ xi ˜ y i  ¨ ¦ xi ¸ ˜ ¨ ¦ y i ¸ i 1 ©i1 ¹ ©i1 ¹

r n

n

2

n

n

§ · § · n ˜ ¦ xi2  ¨ ¦ xi ¸ ˜ n ˜ ¦ y i2  ¨ ¦ y i ¸ i 1 i 1 ©i1 ¹ ©i1 ¹ r

2

, odnosno

r r2 .

Koeficijent proste linearne korelacije (negde se naziva i Pirsonov koeficijent) opisuje postojanje i jaþinu linearne veze izmeÿu dve pojave, u ovom sluþaju obeležja X i Y. To je broj koji uzima vrednosti izmeÿu –1 i 1, to jest važi:  1 d r d 1.

Kada je ovaj koeficijent pozitivan, korelacija je pozitivna (direktna), odnosno poveüanje obeležja X uslovljava poveüanje obeležja Y, a kada je ovaj koeficijent negativan, korelacija je negativna (inverzna), odnosno poveüanje obeležja X uslovljava smanjenje obeležja Y. Što je ovaj koeficijent bliži jedinici po apsolutnoj vrednosti, to je sve jaþa linearna korelaciona veza izmeÿu obeležja, a što je bliži nuli, linearna korelaciona veza je slabija. U statistiþkoj literaturi ne postoji slaganje u pogledu tumaþenja znaþenja moguüih vrednosti proste linearne korelacije r, ali možemo usvojiti sledeüu grubu podelu: 0.7  r d 0.8 - izražena linearna korelacija; 0.8  r d 0.9 - visoka linearna korelacija; 0.9  r  1

- veoma visoka linearna korelacija;

r

- savršena linearna korelacija.

1

221

Poslovna statistika 7.1.6. Standardna greška ocene koeficijenta proste linearne korelacije, sr

Koeficijent proste linearne korelacije u þitavoj populaciji obeležimo sa U, i njega ocenjujemo parametrom koeficijent proste linearne korelacije u uzorku, r. Time þinimo odreÿenu grešku koju opisujemo standardnom greškom ocene koeficijenta proste linearne korelacije, koju obelažavamo sa sr. Standardnu grešku ocene koeficijenta proste linearne korelacije, sr, izraþunavamo po formuli:

sr

1 r2 . n2

Kako je koeficijent korelacije u þitavoj populaciji U nepoznat, potrebno je na osnovu uzorka ispitati da li i u þitavoj populaciji postoji korelacija, odnosno da li je Uz0. To ispitivanje üemo izvršiti dvosmernim testom hipoteza, gde je nulta hipoteza H0: U=0, a alternativna H1:Uz0. Ovim testom prihvatiüemo alternativnu hipotezu H1:Uz0 sa nivoom znaþajnosti D (ovo D predstavlja verovatnoüu da üemo naþiniti grešku I vrste i nema nikakve veze sa parametrom D iz regresione jednaþine populacije Y D  E ˜ X ), ukoliko je r !t D. n  2, sr 2

222

Poslovna statistika 7.1.7. Korišüenje linearnog regresionog modela za predviÿanje vrednosti zavisnog obeležja

Primena linearnog regresionog modela za predviÿenje vrednosti zavisnog obeležja opravdana je ukoliko je koeficijent determinacije visok (dovoljno je da je r2>0.5) i ukoliko je Ez0 sa nivoom znaþajnosti D=0.05. Kako je priroda veze izmeÿu X i Y stohastiþka, to za svaku vrednost xi iz populacije postoji mnogo moguüih vrednosti za yi u populaciji, jer je yi

D  E ˜ xi  H i ,

a Hi je stohastiþki þlan (sluþajni poremeüaj). Taj raspored moguüih vrednosti zavisnog obeležja yi za neku odreÿenu vrednost xi, predstavlja sluþajnu promenljivu Yi. Kako je E (H i ) 0 , to je proseþna vrednost za yi, za unapred zadato xi , jednaka E (Yi )

E (D  E ˜ xi  H i )

E (D  E ˜ xi )  E (H i ) D  E ˜ xi ,

odnosno proseþna vrednost zavisnog obeležja yi, za unapred zadatu vrednost nezavisnog obeležja xi, nalazi se na liniji regresije populacije Y D  E ˜ X . Dakle, na osnovu ocenjenih parametara za D i E (D smo ocenili sa a, E sa b), možemo za datu vrednost nezavisnog obeležja X=xp , predviÿati individualnu vrednost zavisnog obeležja Yp i proseþnu vrednost zavisnog obeležja E(Yp). Kako je Yp

D  E ˜ xp  H p

E (Y p ) D  E ˜ x p

a

,

to je predviÿanje individualne vrednosti zavisnog obeležja neizvesnije od predviÿanja proseþne vrednosti zavisnog obeležja, jer osim neizvesnosti usled ocenjivanja parametara D i E, kod predviÿanja individualne vrednosti postoji i dodatna neizvesnost usled stohastiþnosti þlana Hp.

223

Poslovna statistika Samim tim üe odgovarajuüi interval predviÿanja individualne vrednosti biti širi od intervala predviÿanja proseþne vrednosti zavisnog obeležja, za datu vrednost nezavisnog obeležja.

7.1.8. Interval predviÿanja proseþne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp

Stvarna proseþna vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi E (Y p ) D  E ˜ x p , a ocenjena vrednost iznosi ^

yp

a  b ˜ xp . ^

Meru odstupanja ocenjene vrednosti y p od prave vrednosti E(Yp), opisuje standardna greška ocene proseþne vrednosti zavisnog obeležja, koju oznaþavamo sa s _ , i koju za X=xp izraþunavamo po formuli: yp 2

s_ yp

n § · xi ¸ ¨ ¦ ¨x  i 1 ¸ ¨ p n ¸ ¨ ¸ 1 © ¹ ,  se ˜ 2 n n § · ¨ ¦ xi ¸ n i 1 ¹ 2 xi  © ¦ n i 1

Interval proseþne vrednosti zavisnog obeležja, koji üe sa verovatnoüom 1-D obuhvatiti stvarnu proseþnu vrednost zavisnog obeležja E(Yp), iznosi:

^

^

ypt

n2 ,

D 2

˜ s _ d E Y p d y p  t yp

n2 ,

224

D 2

˜ s_ . yp

Poslovna statistika

7.1.9. Interval predviÿanja individualne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp

Stvarna individualna vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi Yp

D  E ˜ xp  H p ,

a ocenjena vrednost iznosi ^

yp

a  b ˜ xp .

^

Meru odstupanja ocenjene vrednosti y p od prave individualne vrednosti Yp, opisuje standardna greška ocene individualne vrednosti zavisnog obeležja, koju oznaþavamo sa s y p , i koju za X=xp izraþunavamo po formuli: 2

s yp

n § · xi ¸ ¨ ¦ ¨x  i 1 ¸ ¨ p n ¸ ¨ ¸ 1 © ¹ . se ˜ 1   2 n n · § ¨ ¦ xi ¸ n i 1 ¹ 2 xi  © ¦ n i 1

Interval individualne vrednosti zavisnog obeležja, koji üe sa verovatnoüom 1-D obuhvatiti stvarnu individualnu vrednost zavisnog obeležja Yp, iznosi: ^

^

ypt

n2 ,

D 2

˜ s yp d Yp d y p  t

n2 ,

D

˜ s yp .

2

225

Poslovna statistika Evidentno je da je za datu verovatnoüu 1-D, širina intervala i proseþne i individualne vrednosti direktno srazmerna standardnoj greški ocene s _ , yp

odnosno s y p . Analizom izraza za standardnu grešku ocene individualne i proseþne vrednosti, zakljuþujemo da za širinu intervala i proseþne i individualne vrednosti, za datu verovatnoüu 1-D, važi sledeüe: -

poveüanjem standardne greške regresije, se, odnosno poveüanjem raspršenošüu taþaka oko linije regresije, poveüavaju se širine oba intervala;

-

poveüanjem veliþine uzorka (broja n), širine oba intervala se smanjuju;

-

udaljavanjem izabrane vrednosti xp od uzoraþke aritmetiþke sredine obeležja X, širina oba intervala se poveüava; zbog toga bi trebalo predviÿanje vršiti za vrednosti nezavisnog obeležja koja nisu previše udaljene od uzoraþke aritmetiþke sredine obeležja X;

-

poveüanjem disperzije obeležja X, širina oba intervala se smanjuje; zbog toga se pri planiranju uzorka uzima što širi dijapazon moguüih vrednosti obeležja X.

226

Poslovna statistika 7.2. Kvadratna regresija i korelacija

Neka smo iz populacije veliþine N, uzeli sluþajan uzorak veliþine n, i neka su na njemu uzeti parovi uzoraþkih podataka (xi,yi), i = 1, 2, ..., n za obeležja X i Y, þiju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.2.1, indicira da se radi o kvadratnoj zavisnosti obeležja X i Y u þitavoj populaciji, Y D  E ˜ X  J ˜ X 2 (opravdano pretpostavljena zavisnost obeležja X i Y u þitavoj populaciji). Zadatak kvadratne regresione analize je da oceni koeficijente D, E i J, koji opisuju kvadratnu zavisnost u þitavoj populaciji, na osnovu uzoraþkih podataka (xi,yi), i = 1, 2, ..., n. Y

y3

x3 X Slika 7.2.1. Dijagram raspršenosti uzorka Sliþno kao i kod linearne regresije, ukoliko bismo poznavali parametre D, E i J, zbog stohastiþnosti zavisnosti obeležja X i Y važilo bi: yi

D  E ˜ xi  J ˜ xi2  H i ,

i = 1, 2, ..., N,

gde je sa Hi obeležen stohastiþki þlan (sluþajni poremeüaj) i-tog þlana populacije.

227

Poslovna statistika Ovaj stohastiþki þlan Hi je, isto kao i kod linearne regresije, posledica fenomena koje ne opisuje kvadratna regresiona zavisnost obeležja X i Y. U sluþajevima kada taj þlan ima osobine navedene prilikom analize linearnog regresionog modela, oceniüemo parametre D, E i J iz uzoraþkih podataka (xi,yi), i = 1, 2, ..., n, metodom minimiziranja sume svih kvadrata stohastiþkog þlana Hi, izraþunate na uzoraþkim podacima u odnosu na ocenjene vrednosti za D, E i J. Naime, neka je, recimo, ocena parametra D koeficijent a, ocena parametra E koeficijent b, a ocena parametra J koeficijent c. Tada je uzoraþka kvadratna ^

regresiona kriva, koju üemo obeležiti sa y , jednaka: ^

y

a  b ˜ x  c ˜ x2 ,

a za svaki par uzoraþkih podataka (xi,yi), i = 1, 2, ..., n važi sledeüe: yi ^

yi

a  b ˜ xi  c ˜ xi2  H i a  b ˜ xi  c ˜ xi2 .

Koeficijente a, b i c, kao što smo rekli, dobiüemo minimiziranjem sledeüeg izraza n

¦ H i2 i 1

n

^

¦ ( yi  y i ) 2 i 1

n

¦(y

i

 (a  b ˜ xi  c ˜ xi2 )) 2 .

i 1

Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a, b i c, i njihovim izjednaþavanjem sa nulom:

228

Poslovna statistika ªn º w «¦ ( yi  (a  b ˜ xi  c ˜ xi2 )) 2 » ¬i 1 ¼ 0 wa n ª º w «¦ ( y i  (a  b ˜ xi  c ˜ xi2 )) 2 » ¬i 1 ¼ 0 wb n ª º w «¦ ( y i  (a  b ˜ xi  c ˜ xi2 )) 2 » ¬i 1 ¼ 0 wc odakle dobijamo sledeüi sistem jednaþina: n

¦ yi i 1

n

i 1

n

¦ xi ˜ y i i 1 n

¦x

2 i

n

n ˜ a  b ˜ ¦ xi  c ˜ ¦ xi2

˜ yi

i 1

i 1

n

n

n

i 1

i 1

i 1

n

n

n

i 1

i 1

i 1

a ˜ ¦ xi  b ˜ ¦ xi2  c ˜ ¦ xi3 a ˜ ¦ xi2  b ˜ ¦ xi3  c ˜ ¦ xi4

Ovaj sistem jednaþina ima jedinstveno rešenje po a, b i c.

Ovako dobijene ocene za D, E i J su, pod navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi: E (a) D E (b) E E (c ) J .

229

Poslovna statistika

7.2.1. Standardna greška kvadratne regresije, se

Pomoüu ovako dobijenih a, b i c, možemo oceniti varijansu stohastiþkih þlanova Hi , V2 sa s e2 , po formuli: n

s e2

¦H

n

2 i

i 1

n3

¦(y

n

^

i

 yi )2

i 1

¦y 1 1

n

2 i

n

n

1 1

1 1

 a ˜ ¦ yi  b ˜ ¦ xi ˜ yi  c ˜ ¦ xi2 ˜ y i 1 1

n3

n3

i dobiti standardnu grešku regresije, se, po formuli:

n

se

n

^

n

n

n

n

1 1

1 1

1 1

1 1

¦ H i2

¦ ( yi  y i ) 2

¦ yi2  a ˜ ¦ yi  b ˜ ¦ xi ˜ yi  c ˜ ¦ xi2 ˜ yi

n3

n3

n3

i 1

i 1

7.2.2. Koeficijent determinacije kvadratne regresije, r2

Koeficijent determinacije kod kvadratne regresije izraþunavamo po formuli:

r2

§ n ¨ ¦ yi n n n 2 a ˜ ¦ y i  b ˜ ¦ xi ˜ y i  c ˜ ¦ x i ˜ y i  n ˜ ¨ i 1 ¨ n i 1 i 1 i 1 ¨ © § n ¨ ¦ yi n 2 yi  n ˜ ¨ i 1 ¦ ¨ n i 1 ¨ ©

· ¸ ¸ ¸ ¸ ¹

2

2

· ¸ ¸ ¸ ¸ ¹ .

Smisao parametara standardne greške kvadratne regresije, se, i koeficijenta determinacije kvadratne regresije, r2, isti je kao i kod linearne regresije.

230

Poslovna statistika

7.3. Logaritamska regresija i korelacija

Neka smo iz populacije veliþine N uzeli sluþajan uzorak veliþine n, i neka su na njemu uzeti parovi uzoraþkih podataka (xi,yi), i = 1, 2, ..., n za obeležja X i Y, þiju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.3.1, indicira da se radi o logaritamskoj zavisnosti obeležja X i Y u þitavoj populaciji, Y D  E ˜ ln X (opravdano pretpostavljena zavisnost obeležja X i Y u þitavoj populaciji). Zadatak logaritamske regresione analize je da oceni koeficijente D i E, koji opisuju logaritamsku zavisnost u þitavoj populaciji, na osnovu uzoraþkih podataka (xi,yi), i = 1, 2, ..., n. Y

y3

x3 X Slika 7.3.1. Dijagram raspršenosti uzorka

231

Poslovna statistika Uvoÿenjem smene X * ln X , logaritamska regresija Y D  E ˜ ln X svodi se na linearnu regresiju Y D  E ˜ X * , pa se ocena parametara D i E, kao i þitava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto uzoraþkih vrednosti za nezavisnu promenljivu xi, koriste njihovi logaritmi lnxi. To jest, sve formule i zakljuþci iz linearne regresije važe, samo što vrednosti za xi (i = 1, 2, ..., n) zamenjujemo vrednostima lnxi (i = 1, 2, ..., n).

7.4. Eksponencijalna regresija i korelacija

Neka smo iz populacije veliþine N uzeli sluþajan uzorak veliþine n, i neka su na njemu uzeti parovi uzoraþkih podataka (xi,yi), i = 1, 2, ..., n za obeležja X i Y, þiju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.4.1, indicira da se radi o eksponencijalnoj zavisnosti obeležja X i Y u þitavoj populaciji, Y D ˜ e E ˜ X (opravdano pretpostavljena zavisnost obeležja X i Y u þitavoj populaciji). Zadatak eksponencijalne regresione analize je da oceni koeficijente D i E, koji opisuju eksponencijalnu zavisnost u þitavoj populaciji, na osnovu uzoraþkih podataka (xi,yi), i = 1, 2, ..., n. Y

y3

X

x3 Slika 7.4.1. Dijagram raspršenosti uzorka 232

Poslovna statistika Uvoÿenjem smena Y * ln Y , D * ln D , eksponencijalna regresija Y D ˜ e E ˜ X se svodi na linearnu regresiju Y * D *  E ˜ X , pa se ocena parametara D* i E, kao i þitava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto uzoraþkih vrednosti za nezavisnu promenljivu yi, koriste njihovi logaritmi lnyi. Na ovaj naþin dobijamo ocenu parametra D*, recimo a*, dok ocenu parametra * D, koju obeležavamo sa a, dobijamo kao a e a . Sve formule i zakljuþci iz linearne regresije važe, samo što vrednosti za yi (i = 1, 2, ..., n) zamenjujemo vrednostima lnyi (i = 1, 2, ..., n). Primer 7.1. U Tabeli 7.1. prikazani su podaci o cenama i prodatoj koliþini (tražnji) jedne vrste proizvoda.

Cena po 1 kg u dinarima (x) 5 10 12 15 16

Tražnja u tonama (y) 42 30 22 14 6

Tabela 7.1. a) Odrediti parametre linearne regresije i predstaviti je grafiþki. b) Odrediti standardnu grešku regresije se. c) Odrediti standardnu grešku ocene nagiba sb. d) Odrediti koeficijent proste linearne korelacije r, i koeficijent determinacije r2. e) Odrediti standardnu grešku ocene koeficijenta proste linearne korelacije sr. f) Testirati postojanje linearne zavisnosti tražnje ovog proizvoda od njegove cene pomoüu Studentovog t-testa sa nivoom znaþajnosti D = 0,05 za: 1) ocenu nagiba, 2) ocenu proste linearne korelacije. 233

Poslovna statistika g) Odrediti standardnu grešku ocene proseþne vrednosti zavisne promenljive (u ovom sluþaju tražnje) s _ , pri ceni xp=11 din./kg. yp

h) Odrediti standardnu grešku ocene individualne vrednosti zavisne promenljive (u ovom sluþaju tražnje) s y p , pri ceni xp=11 din./kg. i) Oceniti interval proseþne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1-D = 0,95. j) Oceniti interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1-D = 0,95. Rešenje:

a) Linearna regresija ocenjena iz n uzoraþkih parova (xi , yi), data je u ^

obliku y

b

a  b ˜ x , gde je: n § n · § n · n ˜ ¦ x i ˜ y i  ¨ ¦ xi ¸ ˜ ¨ ¦ y i ¸ i 1 ©i1 ¹ ©i1 ¹

n

¦ yi a

i 1

n

b˜

¦x

i

i 1

2 n n § n · 2 n ˜ ¦ xi  ¨ ¦ xi ¸ i 1 ©i1 ¹ Analizirajuüi podatke iz tablice 7.1.a. i imajuüi u vidu da je n=5, dobijamo: n

Cena po 1 kg u din. (xi) 5 10 12 15 16 5

¦x i 1

Tražnja u tonama (yi) 42 30 22 14 6 5

i

58

¦y i 1

x i˜ y i

xi2

yi2

210 300 264 210 96

25 100 144 225 256

1764 900 484 196 36

5

i

114

¦x

5

i

˜ yi

1080

i 1

¦x i 1

Tabela 7.1.a. 234

.

5

2 i

750

¦y i 1

2 i

3380

Poslovna statistika

5 ˜ 1080  58 ˜ 114 5 ˜ 750  58 2

b

3.14

58 114  (3.14) ˜ 5 5

a

59.22

^

Dakle, jednaþina linearne regresije je y predstavljena na sledeüoj slici.

3.14 ˜ x  59.22 i grafiþki je

50 45 40 35 30 25

y = -3.1399x + 59.223 R2 = 0.9745

20 15 10 5 0

0

2

4

6

8

10

12

b) Standardna greška regresije se iznosi: n

n

n

1 1

1 1

1 1

¦ yi2  a ˜ ¦ yi  b ˜ ¦ xi ˜ yi se

n2 3380  59.22 ˜ 114  3.14 ˜ 1080 3

235

2.59

14

16

18

Poslovna statistika c) Standardna greška ocene nagiba sb, iznosi: se

sb

2.59 n

§ · ¨ ¦ xi ¸ xi2  © i 1 ¹ ¦ n i 1

2

58 2 750  5

n

0,295

d) Koeficijent proste linearne korelacije r je: n § n · § n · n ˜ ¦ x i ˜ y i  ¨ ¦ xi ¸ ˜ ¨ ¦ y i ¸ i 1 ©i1 ¹ ©i1 ¹

r

2

n

n § n · § n · n ˜ ¦ x  ¨ ¦ xi ¸ ˜ n ˜ ¦ y i2  ¨ ¦ y i ¸ i 1 i 1 ©i1 ¹ ©i1 ¹ 5 ˜ 1080  58 ˜ 114 0,9872 5 ˜ 750  58 2 ˜ 5 ˜ 3380  114 2

2

2 i

Koeficijent determinacije je kvadrat koeficijenta proste linearne korelacije. tj, koeficijent determinacije je: r2

 0,9872 2

0,9745

e) Standardna greška ocene koeficijenta proste linearne korelacije sr iznosi: sr

1 r2 n2

0,092

236

Poslovna statistika ¸f)

1) Kako je za n=5 i D = 0,05 b  3.14 10.64  t D 3,1824 , n2 , sb 0.295 2 zakljuþujemo pomoüu testa nagiba, uz rizik verovatnoüe 0,05, da se parametar nagiba b razlikuje od nule i da postoji linearna veza izmeÿu cene i tražnje ovog proizvoda.

2) Kako je za n=5 i D = 0,05 r  0,9872 10.73  t D 3,1824 , n2 , sr 0,092 2 zakljuþujemo pomoüu testa korelacije, uz rizik verovatnoüe 0,05, da postoji linearna veza izmeÿu cene i tražnje ovog proizvoda.

g) Standardna greška ocene proseþne vrednosti tražnje ovog proizvoda s _ , pri ceni xp=11 din./kg, je: yp 2

s_ yp

n § · xi ¸ ¨ ¦ ¨x  i 1 ¸ ¨ p n ¸ ¨ ¸ 1 © ¹  se ˜ 2 n § n · ¨ ¦ xi ¸ n i 1 ¹ 2 xi  © ¦ n i 1

237

2

58 · § ¨11  ¸ 1 © 5¹ 2.59 ˜  5 58 2 750  5

1,17

Poslovna statistika

h) Standardna greška ocene individualne vrednosti tražnje ovog proizvoda s y p , pri ceni xp=11 din./kg, je: 2

s yp

n § · xi ¸ ¨ ¦ ¨x  i 1 ¸ ¨ p n ¸ ¨ ¸ 1 © ¹ se ˜ 1   2 n § n · ¨ ¦ xi ¸ n 2 xi  © i 1 ¹ ¦ n i 1 2

58 · § ¨11  ¸ 1 5¹ 2.59 ˜ 1   © 5 58 2 750  5

3.11

i) Kako je ^

y p (11)

3.14 ˜ 11  59.223

24.683 ,

to interval proseþne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1-D = 0,95, iznosi: ^

ypt

^

n2 ,

D 2

˜ s _ d E Y p d y p  t yp

n2 ,

D 2

˜ s_ yp

24.683  3,1824 ˜ 1.17 d E Y p d 24.683  3,1824 ˜ 1.17 20.95 d E Y p d 28.41

238

Poslovna statistika

j) Kako je ^

y p (11)

3.14 ˜ 11  59.223

24.683 ,

to interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1-D = 0,95, iznosi: ^

ypt

^ n2 ,

D

˜ s yp d Yp d y p  t

2

n2 ,

D

˜ s yp

2

24.683  3,1824 ˜ 3.11 d Y p d 24.683  3,1824 ˜ 3.11 14.78 d Y p d 34.58

239

Poslovna statistika

8. INDEKSI

Dosadašnja analiza varijabiliteta odreÿenih obeležja u populaciji nije razmatrala promene obeležja u razliþitim vremenskim trenucima, veü su se analizirale promene obeležja unutar osnovnog skupa (populacije) u okviru jednog vremenskog trenutka (ili intervala) i analiza se usmeravala na strukturu obeležja u okviru populacije ili na povezanosti koje ta struktura ima sa strukturama drugih obeležja. Vreme, dakle, u ovim analizama nije predstavljalo promenljivu, ili faktor zavisnosti, veü je samo odreÿivalo trenutak (ili interval) u kome su analize vršene. Zbog toga se dosadašnji metodi statistiþke analize nazivaju metodi statiþke statistiþke analize. Naravno da se sve pojave (a naroþito ekonomske) manje ili više menjaju u vremenu. Metodi statistiþke analize pomoüu kojih se analizira vremenska zavisnost obeležja, odnosno vremenska zavisnost njegovog varijabiliteta, nazivaju se metodi dinamiþke statistiþke analize. Vremenska zavisnost obeležja prati se pomoüu vremenskih serija, koje predstavljaju nizove podataka o vrednosti odreÿenog obeležja u odreÿenim vremenskim trenucima. Poželjno je da ti izabrani vremenski trenuci budu takvi da su vremenski intervali izmeÿu svaka dva uzajamno sukcesivna trenutka meÿusobno jednaki. Naravno, da bi analiza vremenskih serija omoguüila ispravne zakljuþke o dinamici posmatranog obeležja, neophodno ja da isto obeležje bude definisano i mereno na isti naþin u svim vremenskim trenucima. Na taj naþin se dobijaju takozvane homogene vremenske serije, i one su predmet naše dalje analize. U ovom udžbeniku upoznaüemo dva razliþita metoda dinamiþke statistiþke analize. Prvi metod, koji üemo analizirati u ovom poglavlju, jeste metod indeksa (ili skraüeno – indeksi), po kome se vrši relativno uporeÿivanje vrednosti jednog ili više obeležja u razliþitim vremenskim trenucima, i iz tih relativnih promena obeležja u razliþitim vremenskim trenucima donose se odreÿeni zakljuþci. Drugi metod, koji je analiziran u devetom poglavlju ovog udžbenika, jeste metod dekompozicije vremenskih serija, pomoüu koga se pokušavaju pronaüi osnovne komponente vremenske serije. Takoÿe, u devetom poglavlju 240

Poslovna statistika je dat i osvrt na predviÿanja ponašanja vremenske serije u bliskoj buduünosti, odnosno na prognozu vrednosti obeležja u bliskoj buduünosti. Indeksi koji izražavaju relativnu promenu vrednosti jednog obeležja u razliþitim trenucima, nazivaju se individualni indeksi, dok se indeksi koji izražavaju relativnu promenu vrednosti grupe obeležja u razliþitim trenucima, nazivaju grupni (agregatni) indeksi. Indeksi (i individualni i grupni) generalno se mogu svrstati u tri osnovne grupe: indeks cena, indeks koliþina (indeks fiziþkog obima) i indeks vrednosti (indeks proizvoda koliþina i cena). Iz ovih indeksa izvedeni su razni drugi indeksi: indeks produktivnosti, indeks troškova života, indeks realnih primanja, itd. 8.1. Individualni indeksi

Kao što je reþeno, individualni indeksi su relativni brojevi kojima se prati promena vrednosti jednog obeležja (cena, koliþina...) u razliþitim vremenskim trenucima. Ukoliko se prati promena obeležja u odnosu na jednu unapred izabranu vrednost obeležja iz nekog vremenskog trenutka, onda se takvi indeksi nazivaju bazni. Tada se ta izabrana vrednost obeležja, sa kojom se ostale vrednosti uporeÿuju, naziva baza. Ukoliko se prati promena vrednosti obeležja u jednom trenutku u odnosu na vrednost obeležja iz prethodnog trenutka, onda se takvi indeksi nazivaju lanþani. 8.1.1. Individualni bazni indeksi, Bi

Oznaþimo sa y1 , y 2 , , y n vrednosti obeležja u trenucima t1 , t 2 ,  , t n , gde je sa y i oznaþena vrednost obeležja u trenutku t i , i neka je sa y B oznaþena bazna vrednost obeležja u trenutku t B . Tada se individualni bazni indeksi, koje oznaþavamo sa Bi, izraþunavaju po formuli: yi ˜ 100 (i = 1, 2, ..., n). Bi yB 241

Poslovna statistika

Ukoliko, recimo, bazni indeks u trenutku ti iznosi Bi 106,35 , to znaþi da je vrednost obeležja u trenutku ti za 6,35% veüa od vrednosti obeležja u baznom trenutku, dok ako, recimo, bazni indeks u trenutku ti iznosi Bi 92,34 , to znaþi da je vrednost obeležja u trenutku ti za 7,66% manja od vrednosti obeležja u baznom trenutku. Primer 8.1.1. Koristeüi podatke iz Tabele 8.1.1, analizirati promene ukupnog broja zaposlenih u odnosu na 2002. godinu, koristeüi bazne indekse.

Godina

Broj zaposlenih (000) 178 169 180 195 201

2001. 2002. 2003. 2004. 2005.

Tabela 8.1.1 Rešenje:

Koristeüi formulu za dobijanje baznih indeksa Bi

yi ˜ 100 , gde je bazna yB

godina 2002, dobijamo:

Godina 2001. 2002. 2003. 2004. 2005.

Broj zaposlenih (000) 178 169 180 195 201

Bazni indeks B2002=100 105,33 100 106,5 115,38 118,93

gde je, na primer, B2004 dobijen kao B2004

242

y 2004 ˜ 100 y 2002

195 ˜ 100 115.38 . 169

Poslovna statistika

8.1.2. Individualni lanþani indeksi, Li

Oznaþimo sa y1 , y 2 , , y n vrednosti obeležja u trenucima t1 , t 2 ,  , t n , gde je sa y i oznaþena vrednost obeležja u trenutku t i . Tada se individualni lanþani indeksi, koje oznaþavamo sa Li, izraþunavaju po formuli: yi ˜ 100 ( i = 2, ..., n). Li y i 1 Dakle, ne postoji individualni lanþani indeks prvog þlana vremenske serije jer prvi þlan nema prethodni, pa se nema sa þime uporeÿivati. Ukoliko, recimo, lanþani indeks u trenutku ti iznosi Bi 106,35 , to znaþi da je vrednost obeležja u trenutku ti za 6,35% veüa od vrednosti obeležja u prethodnom trenutku ti-1, dok ako, recimo, bazni indeks u trenutku ti iznosi Bi 92,34 , to znaþi da je vrednost obeležja u trenutku ti za 7,66% manja od vrednosti obeležja u prethodnom trenutku ti-1. Primer 8.1.2. Koristeüi podatke iz Tabele 8.1.2, analizirati promene ukupnog broja zaposlenih koristeüi lanþane indekse.

Godina 2001 2002 2003 2004 2005

Broj zaposlenih (000) 178 169 180 195 201

Tabela 8.1.2.

243

Poslovna statistika

Rešenje:

Koristeüi formulu za dobijanje lanþanih indeksa Li

yi ˜ 100 ( i=2,...,n), y i 1

dobijamo:

Godina 2001. 2002. 2003. 2004. 2005.

Broj zaposlenih (000) 178 169 180 195 201

Lanþani indeks

94,94 106,5 108,33 103,08

gde je na primer L2004 dobijen kao L2004

y 2004 ˜ 100 y 2003

195 ˜ 100 108.33 . 180

8.1.3. Srednji tempo porasta, S

Neka obeležje Y ima tendenciju rasta u periodu t1 do tn. Oznaþimo sa y1 , y 2 , , y n vrednosti obeležja Y u trenucima t1 , t 2 ,  , t n , gde je sa y i oznaþena vrednost obeležja u trenutku t i . Srednji tempo porasta, S, predstavlja proseþnu porast vrednosti obeležja za posmatrani period, i izraþunava se po formuli:

S

§ yn · ¨ n 1  1¸ ˜ 100 . ¨ y ¸ 1 © ¹

244

Poslovna statistika Kako je

n 1

yn y1

n 1

y y 2 y3 ˜ ˜˜ n y1 y 2 y n 1

n 1

L2 ˜ L3 ˜  ˜ Ln ,

to je srednji tempo porasta jednak: S



n 1



L2 ˜ L3 ˜  ˜ Ln  1 ˜ 100 .

Ukoliko, recimo srednji tempo porasta u periodu od t1 do tn iznosi S 6,35 , to znaþi da je vrednost obeležja u periodu od t1 do tn proseþno rasla za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), ( i = 2, ..., n). Primer 8.1.3. Koristeüi podatke iz Tabele 8.1.3, pronaüi srednji tempo porasta broja zaposlenih za period 2001-2005. godine.

Godina 2001. 2002. 2003. 2004. 2005.

Broj zaposlenih (000) 178 169 180 195 201

Tabela 8.1.3.

Rešenje:

§ y 2005 · § · ¨4 ¸ ˜ 100 ¨ 4 201  1¸ ˜ 100 3.08 .  1 ¨ 178 ¸ ¨ y ¸ © ¹ © 2001 ¹ Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se proseþno poveüavao za 3,08% godišnje. Srednji tempo porasta je S

245

Poslovna statistika 8.1.4. Srednji tempo pada, P

Neka obeležje Y ima tendenciju opadanja u periodu t1 do tn. Oznaþimo sa y1 , y 2 , , y n vrednosti obeležja Y u trenucima t1 , t 2 ,  , t n , gde je sa y i oznaþena vrednost obeležja u trenutku t i . Srednji tempo pada, P, predstavlja proseþno opadanje vrednosti obeležja za posmatrani period, i izraþunava se po formuli:

P

§ y · ¨1  n 1 n ¸ ˜ 100 . ¨ y1 ¸¹ ©

Kako je

n 1

yn y1

n 1

y y 2 y3 ˜ ˜˜ n y1 y 2 y n 1

n 1

L2 ˜ L3 ˜  ˜ Ln ,

to je srednji tempo pada jednak: P

1 

n 1



L2 ˜ L3 ˜  ˜ Ln ˜ 100 .

Ukoliko, recimo, srednji tempo pada u periodu od t1 do tn iznosi P 6,35 , to znaþi da je vrednost obeležja u periodu od t1 do tn proseþno opadala za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), (i = 2, ..., n). Primer 8.1.4. Koristeüi podatke iz Tabele 8.1.4, pronaüi srednji tempo pada broja zaposlenih za period 2001-2005. godine.

Godina 2001. 2002. 2003. 2004. 2005.

Broj zaposlenih (000) 178 169 160 162 158

Tabela 8.1.4. 246

Poslovna statistika

Rešenje:

§ · § · y ¨1  4 2005 ¸ ˜ 100 ¨1  4 158 ¸ ˜ 100 2.93 . ¨ ¨ y 2001 ¸¹ 178 ¸¹ © © Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se proseþno smanjivao za 2,93% godišnje. Srednji tempo pada je P

8.2. Grupni (agregatni) indeksi Grupni (agregatni) indeksi su relativni brojevi kojima se prati promena vrednosti grupe srodnih obeležja (cena prehrambenih proizvoda, cena mleþnih proizvoda, koliþina poljoprivredne proizvodnje...) u razliþitim vremenskim trenucima.

Svaki þlan odreÿene grupe obeležja dat je, naravno, u vidu vremenske serije individualnih indeksa tog þlana, a zajedniþka (grupna) analiza se može izvršiti na dva naþina: metodom proseþnih odnosa (srednjih vrednosti) i metodom agregata individualnih indeksa sastavnih serija. U našoj daljoj analizi obeležimo sa pi i qi cenu i koliþinu u posmatranom trenutku, a sa p0 i q0 cenu i koliþinu u baznom periodu. Tada, naravno, vrednost u posmatranom trenutku iznosi p i ˜ qi , a vrednost u baznom trenutku iznosi p0 ˜ q0 .

8.2.1. Metod proseþnih odnosa (srednje vrednosti)

Po metodi proseþnih odnosa, grupni indeks grupe obeležja izraþunava se kao srednja vrednost individualnih baznih indeksa, izraþunatih za istu bazu za svakog þlana grupe. Kako je aritmetiþka sredina prirodna srednja vrednost individualnih baznih indeksa, to se grupni indeksi cena, koliþina i vrednosti, po ovom metodu izraþunavaju po sledeüim formulama:

247

Poslovna statistika pi

Indeks cena, Ip

Ip

¦p

n qi

Indeks koliþina, Iq

Iq

Indeks vrednosti, Ipq

I pq

˜ 100

0

¦q ¦

˜ 100

0

n pi ˜ qi ˜ 100 p0 ˜ q0 , n

gde je n broj þlanova grupe, odnosno broj individualnih indeksa, a znak ¦ oznaþava da se sumiranje vrši takoÿe po svim þlanovima grupe. Primer 8.2.1. Na osnovu podataka iz Tabele 8.2.1, izraþunati za 2005. godinu kao tekuüu i 2000. godinu kao baznu, po metodi proseþnih odnosa, grupni indeks cena, indeks koliþina i indeks vrednosti grupe mleþnih proizvoda.

Proizvod

Kajmak Pavlaka Mleko Jogurt

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550 Tabela 8.2.1.

248

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Poslovna statistika

Rešenje:

Grupa mleþnih proizvoda koju analiziramo sastoji se od n=4 þlana (kajmak, pavlaka, mleko, jogurt), pa koristeüi rezultate Tabele 8.2.1.a., Proizvod Kajmak Pavlaka Mleko Jogurt

pi ˜ 100 p0 120 141,67 150 137,5 ¦=549,17

pi ˜ qi ˜ 100 p0 ˜ q0 130,91 141,67 166,67 206,25 ¦=645,5

qi ˜ 100 q0 109,09 100 111,11 150 ¦=470,2

Tabela 8.2.1.a. po metodi proseþnih odnosa dobijamo: pi

indeks cena

Ip

¦p

n qi

indeks koliþina

Iq

¦q ¦

indeks vrednosti

I pq

˜ 100

0

˜ 100

0

549,17 4 470,2 4

n pi ˜ qi ˜ 100 p0 ˜ q0 n

137,29

117,55

645,5 4

161,375 .

8.2.2. Metod agregata

Generalno, postoje dva naþina primene metode agregata, odnosno izraþunavanja agregatnih indeksa. Jedan od njih je takozvani neponderisani metod agregata, dok je drugi takozvani ponderisani metod agregata. 249

Poslovna statistika 8.2.2.1. Neponderisani metod agregata Neponderisanim metodom agregata se grupni neponderisani agregatni indeks dobija kao koliþnik zbira svih vrednosti obeležja þlanova grupe u posmatranom trenutku i zbira svih vrednosti obeležja þlanova grupe u baznom trenutku.

Dakle, grupni neponderisani agregatni indeksi cena, koliþina i vrednosti, izraþunavaju se po sledeüim formulama: Indeks cena, Ip

Ip

¦ p ˜ 100 ¦p ¦ q ˜ 100 ¦q i

0

Indeks koliþina, Iq

Iq

i

0

Indeks vrednosti, Ipq

I pq

¦p ¦p

i

˜ qi

0

˜ q0

˜ 100 ,

gde je n broj þlanova grupe, odnosno broj individualnih indeksa, a znak ¦ oznaþava da se sumiranje vrši takoÿe po svim þlanovima grupe. Primer 8.2.2.1. Na osnovu podataka iz Tabele 8.2.2.1, izraþunati za 2005. godinu kao tekuüu i 2000. kao baznu, po metodi neponderisanih agregata, grupni indeks cena, indeks koliþina i indeks vrednosti grupe mleþnih proizvoda.

Proizvod

Kajmak Pavlaka Mleko Jogurt

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550 Tabela 8.2.2.1. 250

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Poslovna statistika Rešenje:

Po metodi agregata, grupni neponderisani indeks cena je: ¦ pi ˜ 100 , indeks koliþina je I ¦ qi ˜ 100 a , indeks vrednosti Ip q ¦ p0 ¦ q0 je I pq P ro iz v o d K P M J

¦p ¦p

i

˜ qi

0

˜ q0

˜ 100 . Imajuüi u vidu rezultate iz Tabele 8.2.2.1.a.,

Cena u din./kg 2000. g. p0

Cena u din./kg 2003. g. pi

Prodata koliþina (t) 2000. g. q0

Prodata koliþina (t) 2003. g. qi

1000 600 300 400 ¦p0=2300

1200 850 450 550 ¦pi=3050

55 80 90 40 ¦q0=265

60 55000 80 48000 100 27000 60 16000 ¦qi=300 ¦ = 146000

p0˜q0

pi˜qi

72000 68000 45000 33000 ¦= 218000

Tabela 8.2.2.1.a. dobijamo: indeks cena

Ip

¦ p ˜ 100 ¦p ¦ q ˜ 100 ¦q i

0

indeks koliþina

Iq

i

0

indeks vrednosti

I pq

¦p ¦p

i

˜ qi

0

˜ q0

251

3050 ˜ 100 132,61 2300 300 ˜ 100 113,21 265

˜ 100

218000 ˜ 100 149,32 . 146000

Poslovna statistika 8.2.2.2. Ponderisani metod agregata

Grupni indeksi dobijeni metodom srednje vrednosti i neponderisanim metodom agregata su realni pokazatelji grupnih promena samo ukoliko svi þlanovi grupe imaju približno isti znaþaj u okviru grupe kao celine, što je u praksi veoma retko. U sluþajevima kada þlanovi grupe nemaju približno podjednak znaþaj u okviru grupe kao celine, ponderisani agregatni grupni indeks je indeks koji adekvatno reprezentuje promenu grupe kao celine, izraþunatu na osnovu podataka o promenama svakog þlana grupe ponaosob. Ponderisani agregatni grupni indeks je grupni indeks kod koga se vrednost svake komponente grupe množi nekim brojem (ponderom) koji odreÿuje znaþaj te komponente u grupi. Osnovni je problem kako izabrati ponder svakoj komponenti i pomoüu njega obezbediti realno predstavljanje dinamike svih delova složene grupe.

Uobiþajeno je da se prilikom izraþunavanja indeksa cene za ponder uzimaju vrednosti koliþina, dok se prilikom izraþunavanja indeksa koliþina za ponder uzimaju vrednosti cena þlanova grupe. Analiziraüemo sledeüe naþine izbora pondera: -

Laspeyers-ov metod, Pasche-ov metod, Fisher-ov metod, Marshal-Edgworth-ov metod.

8.2.2.2.1. Laspeyers-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz bazne godine, pa je po njemu: Indeks cena, Ip:

Indeks koliþina, Iq:

Ip

Iq

252

¦p ¦p ¦q ¦q

i

˜ q0

0

˜ q0

i

˜ p0

0

˜ p0

˜ 100

˜ 100 .

Poslovna statistika Primer 8.2.2.2. Na osnovu podataka iz Tabele 8.2.2.2.

Proizvod

Kajmak Pavlaka Mleko Jogurt

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Tabela 8.2.2.2. Izraþunati za 2005 god kao tekuüu i 2000god. kao baznu, po Laspeyersovom metodu ponderisanih agregata, grupni indeks cena i indeks koliþina, grupe mleþnih proizvoda. Rešenje: Koristeüi rezultate Tabele 8.2.2.2.a.,

Proizvod Kajmak Pavlaka Mleko Jogurt

p0 ˜ q0 55000 48000 27000 16000 ¦=146000

pi ˜ q0 66000 68000 40500 22000 ¦=196500

qi ˜ p 0 60000 48000 30000 24000 ¦=162000

Tabela 8.2.2.2.a. dobijamo da je po Laspeyers-ovom metodu agregata grupni ponderisani indeks cena

indeks koliþina

Ip

Iq

¦p ¦p

i

˜ q0

0

˜ q0

¦q ˜ p ¦ p ˜q i

0

0

0

253

˜ 100

196500 ˜ 100 134,59 146000

˜ 100

162000 ˜ 100 110,96 . 146000

Poslovna statistika

8.2.2.2.2. Pasche-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz tekuüe godine, pa je po njemu: Indeks cena, Ip

Indeks koliþina, Iq

Ip

Iq

¦p ¦p ¦q ¦q

i

˜ qi

0

˜ qi

i

˜ pi

0

˜ pi

˜ 100

˜ 100 .

Primer 8.2.2.3. Na osnovu podataka iz Tabele 8.2.2.3.

Proizvod

Kajmak Pavlaka Mleko Jogurt

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Tabela 8.2.2.3. Izraþunati za 2005. godinu kao tekuüu i 2000. kao baznu, po Pasche-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koliþina grupe mleþnih proizvoda.

254

Poslovna statistika

Rešenje:

Koristeüi rezultate Tabele 8.2.2.3.a. Proizvod Kajmak Pavlaka Mleko Jogurt

pi ˜ qi 72000 68000 45000 33000 ¦=218000

pi ˜ q0 66000 68000 40500 22000 ¦=196500

qi ˜ p 0 60000 48000 30000 24000 ¦=162000

Tabela 8.2.2.3.a. dobijamo da je po Pasche-ovom metodu agregata grupni ponderisani indeks cena indeks koliþina

Ip Iq

¦ p ˜q ¦ p ˜q ¦q ˜ p ¦q ˜ p i

i

0

i

i

i

0

i

˜ 100

218000 ˜ 100 134,57 , 162000

˜ 100

218000 ˜ 100 110,94 . 196500

8.2.2.2.3. Fisher-ov metod (Idealni metod)

Po ovom grupnom ponderisanom agregatnom metodu, indeksi se dobijaju kao geometrijska sredina grupnih ponderisanih indeksa dobijenih Laspeyers-ovom metodom i Pasche-ovom metodom. Dakle, Fisher-ov (idealni)

Indeks cena, Ip

IP

255

§ ¨ ¨ ©

¦p ¦p

i

˜ q0

0

˜ q0

˜

˜ qi ·¸ ˜ 100 ¸ 0 ˜ qi ¹

¦p ¦p

i

Poslovna statistika

Iq

Indeks koliþina, Iq

§ ¨ ¨ ©

¦q ¦q

i

˜ p0

0

˜ p0

˜

˜ pi ·¸ ˜ 100 . ¸ 0 ˜ pi ¹

¦q ¦q

i

Primer 8.2.2.4. Na osnovu podataka iz Tabele 8.2.2.4.

Proizvod

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550

Kajmak Pavlaka Mleko Jogurt

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Tabela 8.2.2.4. Izraþunati za 2005. godinu kao tekuüu i 2000. kao baznu, po Fisher-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koliþina grupe mleþnih proizvoda.

Rešenje:

Imajuüi u vidu rezultate dobijene dobijene u Primeru 8.2.2.2. i Primeru 8.2.2.3, dobijamo da je Fisher-ov idealni indeks cena:

IP

§ ¨ ¨ ©

¦p ¦p

i

˜ q0

0

˜ q0

˜ qi ·¸ ˜ 100 ¸ 0 ˜ qi ¹

¦p ˜ ¦p

i

256

1,3459 ˜1,3457 ˜100

134,58

Poslovna statistika

indeks koliþina:

Iq

§ ¨ ¨ ©

¦q ¦q

i

˜ p0

0

˜ p0

˜

˜ pi ·¸ ˜ 100 ¸ 0 ˜ pi ¹

¦q ¦q

1,1096 ˜1,1094 ˜100

i

110,95 .

8.2.2.2.4. Marshal-Edgworth-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao zbir vrednosti iz tekuüe i bazne godine, pa je po njemu:

Indeks cena, Ip

Indeks koliþina, Iq

Ip

Iq

¦p ¦p ¦q ¦q

i

˜ (q 0  qi )

0

˜ (q 0  qi )

i

˜ ( p 0  pi )

0

˜ ( p0  pi )

˜ 100

˜ 100

Primer 8.2.2.5. Na osnovu podataka iz Tabele 8.2.2.5.

Proizvod

Kajmak Pavlaka Mleko Jogurt

Cena u din./kg 2000. g.

Cena u din./kg 2005. g.

(p0) 1000 600 300 400

(pi) 1200 850 450 550 Tabela 8.2.2.5. 257

Prodata koliþina (t) 2000. g. (q0)

Prodata koliþina (t) 2005. g. (qi)

55 80 90 40

60 80 100 60

Poslovna statistika Izraþunati za 2005. godinu kao tekuüu i 2000. kao baznu, po MarshalEdgworth-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koliþina, grupe mleþnih proizvoda.

Rešenje:

Na osnovu Tabele 8.2.2.5.a.,

Proizvod pi ˜ q0  qi

Kajmak Pavlaka Mleko Jogurt

138000 136000 85500 55000 ¦=414500

p 0 ˜ q 0  qi

qi ˜ p 0  pi

q0 ˜ p0  pi

115000 96000 57000 40000 ¦=308000

132000 116000 75000 60000 ¦=383000

121000 116000 67500 38000 ¦=342500

Tabela 8.2.2.5.a.

dobijamo da je po Marshal-Edgworth-ovom metodu

indeks cena Ip

¦p ¦p

i

˜ (q 0  qi )

0

˜ (q 0  qi )

˜ 100

258

414500 ˜ 100 134,58 308000

Poslovna statistika

indeks koliþina

Iq

¦q ¦q

i

˜ ( p 0  pi )

0

˜ ( p0  pi )

˜ 100

383000 ˜ 100 111,82 . 342500

Zadatak 8.3. Na osnovu podataka iz sledeüe tabele,

Proizvod

Kukuruz Pšenica Raž Jeþam Ovas

Cena u din./kg 2001. g. 950 760 330 640 450

Cena u din./kg 2005. g. 1200 850 450 550 500

Prodata koliþina (t) 2001. g. 12 18 20 25 17

Prodata koliþina (t) 2005. g. 16 24 30 22 24

Izraþunati za 2005. godinu kao tekuüu i 2001. kao baznu: a) po metodi agregata grupni neponderisani indeks cena, indeks koliþina, indeks vrednosti; b) po metodi proseþnih odnosa grupni neponderisani indeks cena, indeks koliþina, indeks vrednosti; c) po metodi agregata grupni ponderisani indeks cena i indeks koliþina po Laspeyers-ovom metodu; d) po metodi agregata grupni ponderisani indeks cena i indeks koliþina po Pasche-ovom metodu; e) Fisher-ov idealni indeks cena i indeks koliþina; f) Marshal-Edgworth-ov indeks cena i indeks koliþina.

259

Poslovna statistika 9. ANALIZA VREMENSKIH SERIJA

Neka posmatrano obeležje X u trenucima t1, t2, ..., tn (u našoj analizi ovi trenuci su ekvidistantni), ima vrednosti x1, x2, ..., xn. Tada niz X (i )

xi

X (t i )

i 1,2,..., n

predstavlja jednu vremensku seriju.

Statistiþka analiza promene obeležja X u vremenu svodi se na kvantitativnu analizu varijacije niza X(i). Naravno da su uzroci vremenskih varijacija obeležja X mnogobrojni i raznovrsni, i obiþno nisu svi ni poznati. Zbog toga su razvijene mnogobrojne metode analiza vremenskih serija pomoüu kojih se pokušavaju pronaüi makar bitni uzroci koji generišu vremenske varijacije, odnosno iz odreÿene vremenske serije pokušavaju se pronaüi þinioci serije koji su posledica odreÿenih uzroka. Taj proces se obiþno naziva dekompozicija vremenskih serija na njene osnovne komponente. Analiza vremenskih serija se osim u pravcu pronalaženja osnovnih komponenti serije, razvijala i u pravcu predviÿanja vrednosti serije, odnosno obeležja, u buduünosti, obiþno bliskoj. Analiza predviÿanja vremenske serije obiþno se naziva prognoza serije mada se kod nas veü odomaüio i engleski izraz forecasting. Postoji ogroman broj razliþitih, matematiþki veoma komplikovanih metoda koje su razvijene radi analize vremenskih serija. Proces pronalaženja novih metoda üe još dugo trajati, ali se, generalno, sve te metode mogu svrstati u dve grupe. Prva grupa su metode koje vremenske serije analiziraju u vremenskom domenu, a druga grupa su metode koje vremenske serije analiziraju u frekventnom domenu. Ova druga grupa metoda (analiza u frekventnom domenu) je predmet spektralne (harmonijske) analize u kojoj vodeüu ulogu imaju Furijeovi redovi i kojom se u ovom udžbeniku neüemo baviti. U ovom udžbeniku üemo vremenske serije analizirati u vremenskom domenu, kako u analizi dekompozicije serije, tako i u analizi prognoze, i upoznaüemo se sa metodama koje nisu previše komplikovane. 260

Poslovna statistika 9.1. Dekompozicija vremenskih serija

U veüem broju sluþajeva se kod vremenskih serija mogu izdvojiti njene þetiri osnovne komponente: trend, cikliþna komponenta, sezonska komponenta i rezidualna (sluþajna) komponenta. - Trend je osnovna razvojna tendencija obeležja i nastaje od regularnih uticaja na posmatrnao obeležje. On predstavlja dugoroþnu tendenciju razvoja vremenske serije. Trend komponentu vremenske serije obeležavaüemo sa T, odnosno sa T(i) , i=1,2,...,n. - Cikliþna komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa promenljivom periodom koja je obiþno veüa od jedne godine. Cikliþnu komponentu vremenske serije obeležavaüemo sa C, odnosno sa C(i), i=1,2,...,n. - Sezonska komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa istom periodom koja je obiþno manja do jednaka od jedne godine. Sezonsku komponentu vremenske serije obeležavaüemo sa S, odnosno sa S(i), i=1,2,...,n. - Rezidualna komponenta su sluþajne ili katastrofalne varijacije. Sluþajne varijacije imaju karakter sluþajnih grešaka, dok su katastrofalne varijacije posledica nekih prirodnih ili društvenih kataklizmi (poplave, zemljotresi, ratovi i sl...). Rezidualnu komponentu vremenske serije obeležavaüemo sa R, odnosno sa R(i), i=1,2,...,n.

Za vremensku seriju kažemo da je desezonirana, DX(i), ukoliko iz nje uklonimo sezonsku komponentu S(i). Najþešüi tipovi modela vremenske serije su aditivni model, multiplikativni model i mešoviti (kombinovani) model. Po multiplikativnom modelu vremenska serija je jednaka proizvodu svojih osnovnih komponenti, to jest: X

X (i )

T ˜C ˜ S ˜ R

T (i ) ˜ C (i ) ˜ S (i ) ˜ R(i )

odnosno i=1,2,...,n,

261

Poslovna statistika DX (i )

T (i ) ˜ C (i ) ˜ R(i )

i=1,2,...,n.

Po aditivnom modelu vremenska serija je jednaka zbiru svojih osnovnih komponenti, to jest: X

T C S  R

odnosno

T (i )  C (i )  S (i )  R(i )

X (i ) DX (i )

i=1,2,...,n,

T (i )  C (i )  R(i )

i=1,2,...,n.

Po kombinovanom modelu vremenska serija je jednaka zbiru proizvoda nekih svojih osnovnih komponenti, na primer: X

T ˜C ˜ S  R

X (i ) DX (i )

T (i ) ˜ C (i ) ˜ S (i )  R(i ) T (i ) ˜ C (i )  R(i )

odnosno i=1,2,...,n, i=1,2,...,n.

Naravno da je moguüe da neka od ovih komponenti ne postoji u vremenskim varijacijama obeležja, što zavisi od prirode analiziranog obeležja. Tada ta komponenta nije sastavni deo modela, odnosno jednaka je jedinici u multiplikativnom modelu ili nuli u aditivnom modelu. Ovo se ne odnosi na rezidualnu komponentu, jer ona u svakoj statistiþkoj analizi vremenskih serija uvek postoji. Dekompozicija vremenske serije predstavlja pronalaženje svake od gore navedenih komponetni. Kao jedna od provera pravilno izvedene dekompozicije originalne vremenske serije je i pronalaženje srednje vrednosti rezidualne (sluþajne) komponente. Naime, ako je ona u multiplikativnom modelu bliska jedinici, odnosno u aditivnom modelu bliska nuli, to je dovoljno dobar pokazatelj da je dekompozicija adekvantno izvedena. Kombinovani model se veoma retko koristi, dok su multiplikativni i aditivni model dosta zastupljeni. Dekompoziciju vremenske serije üemo analizirati na multiplikativnom metodu vremenske serije. 262

Poslovna statistika

U procesu dekompozicije vremenske serije koristiüemo jedan specifiþan metod izravnjanja vremenske serije, koji se zove metod pokretnih proseka, PP.

9.1.1. Metod pokretnih proseka (pokretnih sredina), PP

Metod pokretnih proseka najþešüe se koristi za odreÿivanje osnovnog toka pojave, to jest za odreÿivanje trenda (T) ukoliko cikliþna komponenta ne postoji, ili za odreÿivanje proizvoda trenda i cikliþne komponente (T˜C) ukoliko cikliþna komponenta postoji. Pokretni prosek je jedna veštaþka konstrukcija vremenske serije u kojoj je svaki originalni podatak vremenske serije zamenjen aritmetiþkom sredinom tog podatka, odreÿenog broja prethodnih podataka i isto toliko narednih podataka. Ukupan broj þlanova þija se aritmetiþka sredina traži je dakle neparan, i predstavlja red proseka. Tako, ako svaki originalni podatak vremenske serije zamenimo aritmetiþkom sredinom tog podatka, jednog prethodnog i jednog narednog podatka, dobijamo troþlani pokretni prosek. Ukoliko svaki originalni podatak vremenske serije zamenimo aritmetiþkom sredinom tog podatka, dva prethodna i dva naredna podatka, dobijamo petoþlani pokretni prosek, itd. Na primer, neka je data vremenska serija x1, x2, ..., xn. Ako tražimo njen troþlani pokretni prosek, PP(3), tada üe prva pokretna sredina biti __

x2

x1  x 2  x3 3

i ona üe zameniti originalni podatak x 2 ,

druga pokretna sredina üe biti __

x3

x 2  x3  x 4 3

i ona üe zameniti originalni podatak x3 ,

263

Poslovna statistika itd., sve do poslednjeg troþlanog pokretnog proseka __

x n 1

x n  2  x n 1  x n 3

i ona üe zameniti originalni podatak x n 1 .

Uoþimo da ne možemo naüi troþlani prosek prvog i poslednjeg originalnog podatka. Ako tražimo petoþlani pokretni prosek, PP(5), vremenske serije x1, x2, ..., xn, tada üe prva pokretna sredina biti __

x3

x1  x 2  x3  x 4  x5 5

i ona üe zameniti originalni podatak x3 ,

druga pokretna sredina üe biti __

x4

x 2  x3  x 4  x5  x6 5

i ona üe zameniti originalni podatak x 4 ,

itd., sve do poslednjeg troþlanog pokretnog proseka __

x n2

x n  4  x n 3  x n  2  x n 1  x n 5

i ona üe zameniti originalni podatak

xn2 . Uoþimo da ne možemo naüi petoþlani prosek prva i poslednja dva originalna podatka. Ukoliko želimo pronaüi (2˜m+1)-þlani pokretni prosek, PP(m), vremenske serije x1, x2, ..., xn,dobiüemo izravnatu vremensku seriju __

xi

m 1 ˜ ¦ xi  j , 2 ˜ m  1 j m

i

m  1, m  2,  , n  m .

Naravno, u ovom sluþaju ne možemo naüi (2˜m+1)-þlani pokretni prosek, prvih i poslednjih m originalnih podataka.

264

Poslovna statistika Moguüe je koristiti i parne pokretne proseke. Tako, ako je data vremenska serija x1, x2, ..., xn, tada bi njen prvi pokretni prosek grupe od þetiri podatka bio

__

x 2/3 __

x 3/ 4

x1  x 2  x3  x 4 , 4

drugi

x 2  x3  x 4  x5 , 4

itd., i poslednji

x n 3  x n  2  x n 1  x n , 4

__

x n  2 / n 1

__

__

a podatak x3 bi zamenili aritmetiþkom sredinom x 2 / 3 i x 3 / 4 , __ __

x3

__

x 2/3  x 3/ 4 , 2 __

__

podatak x 4 bi zamenili aritmetiþkom sredinom x 3 / 4 i x 4 / 5 , __ __

x4

__

x 3/ 4  x 4/5 , itd., i na kraju 2 __

__

podatak x n  2 bi zamenili aritmetiþkom sredinom x n 3 / n  2 i x n  2 / n 1 , __ __

x n2

__

x n 3 / n  2  x n  2 / n 1 i tako dobili PP(4) originalne serije. 2

Uoþimo da u ovom sluþaju ne možemo naüi pokretni prosek prva i poslednja dva þlana originalne serije.

265

Poslovna statistika Primer 9.1.1. Za vremensku seriju iz Tabele 9.1.1. naüi troþlani, þetvroþlani i petoþlani pokretni prosek i prikazati ih grafiþki.

Period zima 2001. g. proleüe 2002. g. leto 2002. g. jesen 2002. g. zima 2002. g. proleüe 2003. g leto 2003 g. jesen 2003. g. zima 2003. g. proleüe 2004. g. leto 2004. g. jesen 2004. g. zima 2004. g. proleüe 2005. g. leto 2005. g. jesen 2005. g.

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

xi 182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

Tabela 9.1.1.

Rešenje:

Troþlani PP(3), þetvoroþlani PP(4) i petoþlani pokretni prosek PP(5) originalne serije dat je u Tabeli 9.1.1.a.

266

Poslovna statistika PP(3) 1

i

xi

__

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

¦ xi  j j 1

3

160.3 151.3 156 154 148.3 147.3 154.7 158 146.3 138.7 144.3 150.7 148.7 142

PP(4)

__

x i / i 1

PP(5)

__

2

2

4

xi xi 1 / i  xi / i 1 2

159 155.25 152 150 152.25 151 153 150.75 144.5 145.25 145.25 146.25 147.75

157.125 153.625 151 151.125 151.625 152 151.875 147.625 144.875 145.25 145.75 147

¦ xi  j j 1

Tabela 9.1.1.a. Grafiþki prikaz PP(3), PP(4) i PP(5) dat je na slici 9.1.1.

267

__

xi

¦x j 2

5

160.6 152.2 149.2 152.8 154.2 150.4 148.2 148.4 148.6 145.8 142.8 146

i j

Poslovna statistika 200 180 160 140 Originalna serija

120

PP(3)

100

PP(5)

80

PP(4)

60 40 20 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Slika 9.1.1. Grafiþki prikaz PP(3), PP(4) i PP(5)

9.1.2. Odreÿivanje trenda, T(i)

Kao što je veü napomenuto, ukoliko u vremenskoj seriji nije izraženo prisutna cikliþna komponenta, onda trend aproksimiramo pokretnim prosecima, odnosno T(i)=PP(i). Meÿutim, ukoliko je evidentno prisustvo cikliþne komponente, onda pokretni prosek predstavlja proizvod trenda i cikliþne komponente, odnosno tada prihvatamo da važi T(i)˜C(i)=PP(i). U ovom sluþaju (uoþeno prisustvo cikliþne komponente), trend nalazimo pronalaženjem glatke krive T(i), koja ima najmanji kvadrat greške u odnosu na podatke originalne serije (i,xi). Dakle, potpuno identiþno kao i kod regresione analize, samo što u ovom sluþaju metodom najmanjih kvadrata tražimo

268

Poslovna statistika zavisnost izmeÿu vrednosti obeležja X i vremena t na osnovu podataka (i,xi) i=1,2,...,n. Naravno da i u ovom sluþaju može postojati linearna veza izmeÿu vrednosti obeležja i vremena koja odreÿuje linearni trend, zatim paraboliþna, eksponencijalna, logaritamska, itd. Sve formule pomoüu kojih se metodom najmanjih kvadrata dobijaju razne regresione krive, a koje su date u 7. poglavlju ovog udžbenika, važe i za odreÿivanje trenda vremenske serije. Primer 9.1.2. Pronaüi linearni trend vremenske serije iz Tabele 9.1.1. pod pretpostavkom da postoji cikliþna komponenta. Predstaviti ga grafiþki i tabliþno. Rešenje:

Linearni trend ocenjen iz n uzoraþkih parova (i , xi), dat je u obliku T (i ) a  b ˜ i gde je

b

n § n · § n · n ˜ ¦ i ˜ xi  ¨ ¦ i ¸ ˜ ¨ ¦ xi ¸ i 1 ©i1 ¹ ©i1 ¹ n

n

· § n ˜ ¦i2  ¨¦i¸ i 1 ©i1 ¹

2

Rešavanjem ovih jednaþina dobijamo b 1.3618 linearni trend je oblika T (i ) 1.3618 ˜ i  162.45 .

n

¦ xi a

i 1

n

n

b˜

¦i i 1

n

.

a 162.45 , odnosno

Ovaj linearni trend je predstavljen grafiþki na Slici 9.1.2., a tabliþno Tabelom 9.1.2.

269

Poslovna statistika

200 180 160 140 120

y = -1.3618x + 162.45

100

Series1 Linear (Series1)

80 60 40 20 0 0

5

10

15

20

Slika 9.1.2. Linearni trend serije iz Tabele 9.1.1.

T(i)

i

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

T (i )  1.3618 ˜ i  162.45 161.1 159.7 158.4 157 155.6 154.3 152.9 151.6 150.2 148.8 147.5 146.1 144.7 143.4 142 140.7

Tabela 9.1.2. Trend serije

270

Poslovna statistika 9.1.3. Odreÿivanje cikliþne komponente, C(i)

Kako je po multiplikativnom modelu , za PP reda 2˜m+1, PP(i )

T (i ) ˜ C (i )

i=m+1,m+2, ... , n-m,

to se cikliþna komponenta odreÿuje iz C (i )

PP(i ) T (i )

i=m+1,m+2, ... , n-m .

ýesto se radi lakšeg predstavljanja cikliþna komponenta predstavlja u obliku C(i)˜100. Primer 9.1.3. Za vremensku seriju iz Tabele 9.1.1. pronaüi cikliþnu komponentu, uz uslov izravnjanja troþlanim pokretnim prosecima. Predstaviti cikliþnu komponentu tabliþno i grafiþki. Rešenje:

Imajuüi u vidu da je C (i )

PP(i ) T (i )

i=m+1,m+2, ... , n-m ,

dobijamo sledeüe vrednosti za cikliþnu komponentu (Tabela 9.1.3. i Slika 9.1.3).

271

Poslovna statistika

PP(3)

T(i)

xi

¦x

__

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

j 1

3

160.3 151.3 156 154 148.3 147.3 154.7 158 146.3 138.7 144.3 150.7 148.7 142

i j

C(i)˜100

C (i )

T (i )

1

i

C(i)

 1.3618 ˜ i  PP(3)(i ) T (i ) 162.45 161.1 159.7 158.4 157 155.6 154.3 152.9 151.6 150.2 148.8 147.5 146.1 144.7 143.4 142 140.7

1.0038 0.9556 0.9936 0.9895 0.9614 0.9635 1.0205 1.0520 0.9832 0.9403 0.9879 1.0409 1.0368 0.9998

Tabela 9.1.3. Cikliþna komponenta serije

Ciklicna komponenta C(I) 1.1 1.05 1 0.95 0.9 0.85 Ciklicna komponenta C(I)

Slika 9.1.3. Cikliþna komponenta serije 272

100.38 95.56 99.36 98.95 96.14 96.35 102.05 105.20 98.32 94.03 98.79 104.09 103.68 99.98

Poslovna statistika 9.1.4. Odreÿivanje sezonske komponente, S(i)

Sezonsku komponetu dobijamo usrednjavanjem proizvoda sezonske i rezidualne komponente. Usrednjavanje se vrši po sezonama za koje tražimo sezonsku komponentu, a proizvod sezonske i rezidualne komponente dobijamo kao koliþnik originalne serije i serije pokretnih proseka. Naime, po multiplikativnom modelu važi: X (i )

T (i ) ˜ C (i ) ˜ S (i ) ˜ R(i )

PP(i )

T (i ) ˜ C (i )

i=1,2,...,n i=m+1,m+2, ... , n-m ,

pa je S (i ) ˜ R (i )

T (i ) ˜ C (i ) ˜ S (i ) ˜ R(i ) T (i ) ˜ C (i )

X (i ) PP(i )

i=m+1,m+2, ... , n-m.

Sezonsku komponentu, koja se još naziva i sezonski indeks, dobijamo usrednjavanjem proizvoda S(i)˜R(i) po sezonama za koje tražimo sezonski indeks. ýesto se radi lakšeg predstavljanja sezonska komponenta predstavlja u obliku S(i)˜100. Pokažimo to na primeru vremenske serije iz Tabele 9.1.1. Primer 9.1.4. Za vremensku seriju iz Tabele 9.1.1. pronaüi sezonsku komponentu, uz uslov izravnanja troþlanim pokretnim prosecima. Rešenje:

Kako je

S (i ) ˜ R (i )

T (i ) ˜ C (i ) ˜ S (i ) ˜ R(i ) T (i ) ˜ C (i )

X (i ) PP(i )

to je (videti Tabelu 9.1.4). 273

i=m+1,m+2, ... , n-m ,

Poslovna statistika

PP(3)

i

xi

__

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

S(i)˜R(i)

1

S (i ) ˜ R(i )

j 1

X (i ) PP(3)(i )

¦ xi  j 3

160.3 151.3 156 154 148.3 147.3 154.7 158 146.3 138.7 144.3 150.7 148.7 142

0.9543 0.9648 0.9936 1.0844 0.9438 0.9367 1.0603 1.0253 1.0114 0.9303 0.9630 1.0951 0.9955 0.9366

S(i)˜R(i)˜100

95.43 96.48 99.36 108.44 94.38 93.67 106.03 102.53 101.14 93.03 96.30 109.51 99.55 93.66

Tabela 9.1.4. Proizvod sezonske i rezidualne komponente serije Sezonsku komponentu dobijamo usrednjavanjem proizvoda sezonske i rezidualne komponente serije S (i ) ˜ R(i ) , gde se usrednjavanje vrši po sezoni za koju tražimo sezonski indeks ( u ovom sluþaju po godišnjim dobima). Za originalnu seriju iz našeg primera, indeksi reprezentuju: i=1,5,9,13, zimski period, i=2,6,10,14, proleüni, i= 3,7,11,15 letnji, i=4,8,12,16 jesenji period, pa je (videti Tabelu 9.1.4.a),

274

Poslovna statistika

Zima 2002 2003 2004 2005

Proleüe 0.9543

Leto

Jesen

0.9648 0.9367 0.9303

0.9936 1.0603 0.9630

1.0844 1.0253 1.0951

0.9438 1.0114 0.9955

0.9366

1.0683

0.9762

0.9421

_____

S

S˜R

1.0056

Tabela 9.1.4.a odnosno sezonska serija S(i) data je u Tabeli 9.1.4.b.

PP(3)

i

xi

__

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

S(i)˜R(i)

S(i)

1

S (i ) ˜ R(i )

S (i )

j 1

X (i ) PP(3)(i )

S (i ) ˜ R(i )

0.9543 0.9648 0.9936 1.0844 0.9438 0.9367 1.0603 1.0253 1.0114 0.9303 0.9630 1.0951 0.9955 0.9366

0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421

¦ xi  j 3

160.3 151.3 156 154 148.3 147.3 154.7 158 146.3 138.7 144.3 150.7 148.7 142

____________

Tabela 9.1.4.b. Sezonska komponenta serije

275

S(i)˜100

97.62 94.21 100.56 106.83 97.62 94.21 100.56 106.83 97.62 94.21 100.56 106.83 97.62 94.21

Poslovna statistika 9.1.5. Odreÿivanje rezidualne komponente, R(i)

Rezidualna komponenta serije dobija se kao koliþnik proizvoda sezonske i rezidualne komponete i sezonske komponente originalne serije, odnosno R (i )

S (i ) ˜ R(i ) S (i )

i=m+1,m+2, ... , n-m .

ýesto se radi lakšeg predstavljanja i rezidualna komponenta predstavlja u obliku R(i)˜100. Pokažimo to na primeru vremenske serije iz Tabele 9.1.1.

Primer 9.1.5. Za vremensku seriju iz Tabele 9.1.1. pronaüi rezidualnu komponentu, uz uslov izravnjanja troþlanim pokretnim prosecima. Prikazati je tabelarno i grafiþki i prokomentarisati njenu aritmetiþku sredinu. Rešenje:

Kako je R (i )

S (i ) ˜ R(i ) S (i )

i=m+1,m+2, ... , n-m ,

to je (videti Tabelu 9.1.5).

276

Poslovna statistika

S(i)˜R(i)

PP(3) 1

i

xi

__

xi

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

¦x j 1

3

160.3 151.3 156 154 148.3 147.3 154.7 158 146.3 138.7 144.3 150.7 148.7 142

i j

S(i)

R(i)

S (i ) ˜ R(i )

S (i )

R (i )

X (i ) PP(3)(i )

____________

S (i ) ˜ R(i )

S (i ) ˜ R(i ) S (i )

0.9543 0.9648 0.9936 1.0844 0.9438 0.9367 1.0603 1.0253 1.0114 0.9303 0.9630 1.0951 0.9955 0.9366

0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421

0.9775 1.0240 0.9881 1.0151 0.9668 0.9942 1.0544 0.9598 1.0360 0.9875 0.9577 1.0251 1.0198 0.9942

Tabela 9.1.5. Rezidualna komponenta Grafik rezidualne komponente dat je na Slici 9.1.5. Rezidualna komponenta R(I) 1.1 1.05 1 0.95 0.9 Rezidualna komponenta R(I)

Slika 9.1.5. Rezidualna komponenta 277

Poslovna statistika Aritmetiþka sredina rezidualne komponente iznosi 15

¦ R(i) i 2

14

1.000018 ,

što ukazuje na þinjenicu da je dekompozicija originalne vremenske serije adekvatno izvršena.

9.1.6. Odreÿivanje desezonirane serije, DX(i)

Desezoniranu seriju dobijamo iz originalne serije kada iz nje eliminišemo sezonsku komponentu. Dakle, DX (i )

X (i ) S (i )

i=m+1,m+2, ... , n-m .

Primer 9.1.6. Desezonirati vremensku seriju iz Tabele 9.1.1, uz uslov izravnjanja troþlanim pokretnim prosecima. Prikazati desezoniranu seriju tabelarno i grafiþki. Rešenje:

Kako je

DX (i )

X (i ) S (i )

i=m+1,m+2, ... , n-m ,

to je (videti Tabelu 9.1.6).

278

Poslovna statistika

S(i)

S (i ) i

xi

____________

S (i ) ˜ R(i )

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421 1.0056 1.0683 0.9762 0.9421

DX(i)

DX (i ) X (i ) S (i )

156.73 154.97 154.14 156.32 143.41 146.48 163.09 151.64 151.61 136.93 138.23 154.45 151.61 141.17

Tabela 9.1.6. Desezonirana serija Grafiþki prikaz dat je na Slici 9.1.6. Desezonirana serija DX(I) 170 160 150 140 130 120 Desezonirana serija DX(I)

Slika 9.1.6. Desezonirana serija 279

Poslovna statistika Zadatak 9.1.1. Za seriju xt iz sledeüe tabele Period zima 2001. g. proleüe 2002. g. leto 2002. g. jesen 2002. g. zima 2002. g. proleüe 2003. g. leto 2003. g. jesen 2003. g. zima 2003. g. proleüe 2004. g. leto 2004. g. jesen 2004. g. zima 2004. g. proleüe 2005. g. leto 2005. g. jesen 2005. g.

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

xt 375 344 347 358 369 335 330 359 357 348 325 338 364 342 330 346

odrediti mulitiplikativnim metodom: a) sezonsku i rezidualnu komponentu serije, sezonske indekse i desezoniranu seriju i predstaviti ih grafiþki; b) cikliþnu komponentu serije, pretpostavljajuüi da serija ima linearni trend, i predstaviti je grafiþki.

280

Poslovna statistika 9.2. Prognoza vremenske serije

Metod dekompozicije, baziran na poravnanju vremenske serije pokretnim prosecima, neupotrebljiv je za predviÿanje ponašanja vremenske serije u buduünosti, jer se pokretnim prosecima gube informacije na krajevima vremenskog intervala (za poslednjih m taþaka originalne serije ne možemo naüi pokretni prosek reda (2˜m+1). Zbog toga se u ovom sluþaju prognoza vrednosti obeležja X u trenutku i+1, dobija kao vrednost funkcije trenda u taþki i+1. Ova prognoza nije dovoljno precizna za ozbiljnije analize predviÿanja vrednosti obeležja u buduünosti. Generalno, ako sa fi obeležimo prognozirane vrednosti obeležja xi u trenutku i, onda važi: f i 1

T (i  1) .

Primer 9.2.1. Proceniti vrednost vremenske serije iz Tabele 9.1.1. za zimu 2005. pomoüu linije trenda. Rešenje:

Kako je linija trenda ove serije oblika T (i ) 1.3618 ˜ i  162.45 , i kako za zimu 2005. indeks i=17, to je prognozirana vrednost analiziranog obeležja u zimu 2005. iznosi: T (17)

1.3618 ˜ 17  162.45 139.30 .

Drugi, precizniji metod prognoze vremenske serije, postiže se metodom eksponencijalnog poravnanja.

9.2.1. Eksponencijalno poravnanje

Kod esponencijalnog poravnanja smatra se da su uslovi koji su generisali prvi prethodni þlan od najveüeg uticaja na prognozirani sledeüi þlan, zatim uslovi koji su generisali drugi þlan koji prethodi prognoziranom imaju drugi po veliþini stepen uticaja, itd. 281

Poslovna statistika Po ovom modelu, ekponencijalno poravnate vrednosti, fi, vremenske serije, xi, i=1,2,...,n, dobijaju se po sledeüem rekurentnom obrascu: f1

x1

f i 1

a ˜ xi  1  a ˜ f i

0  a  1,

i 1,2,, n.

Oþigledno da na ovaj naþin, za i=n, dobijamo prognoziranu vrednost u bliskoj buduünosti f n 1

a ˜ x n  1  a ˜ f n .

Broj a je ponder koji odreÿuje stepen uticaja uslova koji su determinisali prvi prethodni þlan, dok ponder (1-a) ukazuje na to da je uticaj svake prethodne opservacije (1-a) puta manji. Naime, važi:

f1

x1

f i 1

a ˜ xi  1  a ˜ f i

a ˜ xi  1  a ˜ a ˜ xi 1  1  a ˜ f i 1 

a ˜ xi  a ˜ 1  a ˜ xi 1  a ˜ 1  a ˜ xi  2  a ˜ 1  a ˜ xi 3   2

3

Imajuüi u vidu da je greška prognoze u trenutku i jednaka ei

xi  f i ,

ovaj model eksponencijalnog izravnjanja se može pretstaviti i u obliku f1 f i 1

x1 a ˜ xi  1  a ˜ f i

0  a  1,

f i  a ˜ xi  f i

i 1,2,  , n.

282

f i  a ˜ ei

Poslovna statistika Tako da je nova prognoza jednaka zbiru prethodne prognoze i korekcije za grešku prognoze. Za primenu u prognozi, pošeljno je da ponder a bude veüi od 0.7. Dok, u sluþajevima u kojima eksponencijalno izravnjanje koristimo umesto serije pokretnih proseka u procesu desezoniranja, poželjno je da ponder a bude manji od 0.4. Primer 9.2.2. Za vremensku seriju iz Tabele 9.1.1, predstaviti tabelarno i grafiþki eksponencijalno izravnjanje za parametar a=0.8 i a=0.3. Takoÿe, pomoüu ekponencijalno poravnate serije parametrom a=0.8 predvideti vrednost obeležja za zimu 2005. Rešenje:

Eksponencijalno izravnata serija ft izraþunata po formuli f1 f i 1

x1 a ˜ xi  1  a ˜ f i

i 1, 2,... n  1

za a= 0,8 i a=0.3 prikazana je Tabelom 9.2.2. i Slikom 9.2.2.

Period zima 2001 god. proleüe 2002 god leto 2002 god jesen 2002 god zima 2002 god. proleüe 2003 god leto 2003 god jesen 2003 god zima 2003 god. proleüe 2004 god leto 2004 god jesen 2004 god zima 2004 god. proleüe 2005 god leto 2005 god jesen 2005 god

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

xi 182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

a=0.8 182 182 158.8 148.56 153.71 164.34 144.87 139.37 159.07 161.41 150.68 133.34 137.87 159.57 150.31 136.46

a=0.3 182 182 173.3 165.11 162.08 163.55 156.49 150.94 154.86 157 154.3 146.71 144.4 150.58 149.8 144.76

Tabela 9.2.2 Eksponencijalno poravnanje za a=0.8 i a=0.3 283

Poslovna statistika Grafik originalne serije i serija eksponencijalnih izravnanja za a=0.8 i a=0.3 dat je na Slici 9.2.2. 200 180 160 140 120 100 80 60 40 20 0 Originalna serija X(I)

Eksponencijalno poravnjanje a=0.8

Eksponencijalno poravnjanje a=0.3

Slika 9.2.2. Grafik originalne serije i ekponencijalno poravnate serije za a=0.8 i a=0.3

Prognozirana vrednost obeležja za zimu 2005. po metodi ekponencijalnog poravnanja za a=0.8 iznosi: f17

a ˜ x16  1  a ˜ f16

0.8 ˜ 145  0.2 ˜ 136.46 143.29 .

U smislu korišüenja metode eksponencijalnog izravnjanja za prognoze vrednosti vremenske serije, preporuþuje se njena sledeüa modifikovana verzija, po kojoj se izravnate vrednosti fi, vremenske serije, xi, i=1,2,...,n, dobijaju po sledeüem rekurentnom obrascu:

f1 f i 1

x1 a ˜ xi 1  1  a ˜ f i

0  a  1,

284

i 1,2,, n  1.

Poslovna statistika

Na ovaj naþin prognozirana vrednost u trenutku n+1 iznosi f n 1

a ˜ x n  1  a ˜ f n .

Po ovom metodu, za podatke originalne serije iz Primera 9.2.2. dobijamo sledeüe vrednosti poravnanja i prognoze za zimu 2005. (Tabela 9.2.2.a. i Slika 9.2.2.a)

Period zima 2001. g. proleüe 2002. g. leto 2002. g. jesen 2002. g. zima 2002. g. proleüe 2003. g. leto 2003. g. jesen 2003. g. zima 2003. g. proleüe 2004. g. leto 2004. g. jesen 2004. g. zima 2005. g. proleüe 2005. g. leto 2005. g. jesen 2005. g.

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

xi 182 153 146 155 167 140 138 164 162 148 129 139 165 148 133 145

a=0.8 182 158.8 148.56 153.71 164.34 144.87 139.37 159.07 161.41 150.68 133.34 137.87 159.57 150.31 136.46 143.29

a=0.3 182 173.3 165.11 162.08 163.55 156.49 150.94 154.86 157 154.3 146.71 144.4 150.58 149.8 144.76 144.83

Tabela 9.2.2.a. Poboljšano eksponencijalno poravnanje za a=0.8 i a=0.3

Grafik originalne serije i serija poboljšanih eksponencijalnih izravnanja za a=0.8 i a=0.3 dat je na Slici 9.2.2.a.

285

Poslovna statistika

200 150 100 50 0 Originalna serija X(I) Poboljsano eksponencijalno poravnjanje a=0.8 Poboljsano eksponencijalno poravnjanje a=0.3

Slika 9.2.2a. Grafik originalne serije i poboljšano ekponencijalno poravnate serije za a=0.8 i a=0.3

Prognozirana vrednost obeležja za zimu 2005. po metodi poboljšanog ekponencijalnog poravnanja za a=0.8 iznosi: f17

a ˜ x16  1  a ˜ f16

0.8 ˜ 145  0.2 ˜ 143.29 144.66 .

286

Poslovna statistika Zadatak 9.2.2. Za seriju iz sledeüe tabele prognozirati vrednost za januar 2006, koristeüi oba metoda eksponencijalnog izravnanja sa konstantom a=0,9 i predstaviti grafiþki originalnu i poravnate serije.

2004. g. januar februar mart april maj jun jul avgust septembar oktobar novembar decembar

t 1 2 3 4 5 6 7 8 9 10 11 12

xt 110 138 215 250 203 248 308 327 359 375 420 465

2005 god januar februar mart april maj jun jul avgust septembar oktobar novembar decembar

287

t 13 14 15 16 17 18 19 20 21 22 23 24

xt 478 485 505 535 576 587 612 645 684 716 723 758

Poslovna statistika

LITERATURA x Aczel, A. D. – Sounderpandian, J.: Complete Business Statistics, 5th Edition, Mc Grew-Hill, 2002. x Berenson, M. L. –Levine, D. M. – Krehbiel, T. C.: Basic Business Statistics Concepts and Applications, 8th Edition, Prentice Hall, 2002. x Ivkoviü, Z. A.: Matematiþka statistika, „Nauþna knjiga”, Beograd, 1992. x Mališiþ, J.: Vremenske serije, Matematiþki fakultet, Beograd, 2002. x Mariü, N. – Raleviü, N. – Filipoviü, L.: Poslovna statistika, Megatrend univerzitet primenjenih nauka, Beograd, 2001. x Merkle, M. – Vasiü, P.: Verovatnoüa i statistika, „Akademska misao”, Beograd 2001. x Mladenoviü, P.: Verovatnoüa i statistika, Matematiþki fakultet, Beograd, 2002. x Peter, J. – Brockwell, R. – Davis, A.: „Introduction to Time Series and Forecasting”, Springer Texts in Statistics, 2nd Edition, 2002. x Spanos, Aris.: Probability Theory and Statistical Inference, Econometric Modeling with Observational Data, Cambridge University Press, 1999. x Vukadinoviü, S. V.: Elementi teorije verovatnoüe i matematiþke statistike, „Privredni pregled”, Beograd, 1990. x Vukadinoviü, S. V.: Zbirka rešenih zadataka iz matematiþke statistike, „Nauþna knjiga”, Beograd, 1988. x Vukadinoviü, S. V.: Zbirka rešenih zadataka iz teorije verovatnoüe, „Privredni pregled”, Beograd, 1990. x Žižiü, M. –Lovriü, M. –Pavliþiü, D.: Metodi statistiþke analize, Ekonomski fakultet, Beograd, 2001.

288

DODATAK TABLICE

¢©ª

w’–’™‘„ê–—„—Œ–—ŒŽ„

w’–’™‘„ê–—„—Œ–—ŒŽ„

¢©¡

¢©¢

w’–’™‘„ê–—„—Œ–—ŒŽ„

w’–’™‘„ê–—„—Œ–—ŒŽ„

¢©£

¢©¤

w’–’™‘„ê–—„—Œ–—ŒŽ„

w’–’™‘„ê–—„—Œ–—ŒŽ„

¢©¥

¢©¦

w’–’™‘„ê–—„—Œ–—ŒŽ„

w’–’™‘„ê–—„—Œ–—ŒŽ„

¢©§

Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu. Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine. Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih radova u domaćim i međunarodnim stručnim publikacijama. Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakultetu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.

ISBN 86-7747-205-3

Prof. dr Dušan Joksimović • POSLOVNA STATISTIKA

Prof. dr Dušan Joksimović

POSLOVNA STATISTIKA

Megatrend univerzitet primenjenih nauka, Beograd, 2006.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF