Statistika u ekonomiji i menadžmentu

October 6, 2017 | Author: shya456 | Category: N/A
Share Embed Donate


Short Description

Download Statistika u ekonomiji i menadžmentu...

Description

Naziv djela: Statistika u ekonomiji i menadžmentu Drugo izdanje Autor: Prof. dr Rabija Somun-Kapetanović Izdavač: Ekonomski fakultet u Sarajevu Glavni i odgovorni urednik: Dekan, prof. dr Muris Čičić Recenzenti: Prof. dr Divna Janković Prof. dr Želimir Vučković Urednik: Prof. dr Hasan Muratović Lektor: Dr Aiša Softić DTP: Engin Mešanović Štampa: VMG Grafika, Mostar Tiraž: 300 Godina izdanja: 2008. ---------------------------------------------------------------------------CIP – Katalogizacija u publikaciji Nacionalna i univerzitetska biblioteka Bosne i Hercegovine, Sarajevo 330. 45: 512. 2] (075. 8) SOMUN-Kapetanović, Rabija Statistika u ekonomiji i menadžmentu / Rabija Somun-Kapetanović. – 2. izd. – Sarajevo : Ekonomski fakultet, 2008. – 424 str. : graf. prikazi ; 24 cm Bibliografija: str. 423-424 ISBN 978-9958-25-008-8 I. Kapetanović, Rabija Somun – vidi Somun-Kapetanović, Rabija COBISS.BH-ID 16445958 ------------------------------------------------------------------------

Dr Rabija Somun-Kapetanović

STATISTIKA U EKONOMIJI I MENADŽMENTU DRUGO IZDANJE

Sarajevo, 2008. godine

PREDGOVOR PRVOM IZDANJU Postoji više pristupa prezentaciji statističke metodologije. Dva ekstremna slučaja su prezentacije kompletno matematizirane i apstraktne i prezentacije potpuno deskriptivne, bez provjere i izvođenja dokaza. Pristup koji smo mi primijenili u prezentaciji nalazi se između ova dva ekstremna slučaja i ima dva osnovna cilja. To su prezentacija i aplikacija analiziranih metoda i razumijevanje i interpretacija dobijenih rezultata. Ova knjiga je namijenjena prvenstveno studentima ekonomije, menadžmenta i ostalih društvenih nauka. Iako su bazni koncepti statistike univerzalni, naš pristup je baziran na analizi, prezentaciji i aplikaciji osnovnih koncepata u domenu ekonomije i menadžmenta. Osnovne definicije, osobine i rezultati su izvedeni i dokazani u mjeri u kojoj smo to smatrali korisnim za razumijevanje i aplikaciju prezentirane problematike. Sadržaj ovog izdanja knjige je rezultat dugogodišnjeg autorovog iskustva u nastavi iz oblasti Kvantitativne ekonomije i predmeta: Matematičke metode u ekonomiji, Međusektorska analiza, Operaciona istraživanja, Statistika, Eksperimentalna statistika, Statistika u ekonomiji i menadžmentu, Poslovna statistika, Kvantitativne metode i Demografija na Ekonomskom fakultetu u Sarajevu, Fakultetu ekonomskih nauka i upravljanja Univeziteta Louis Pasteur u Strasbourg-u (Faculté des sciences économiques et de gestion de l’Université Louis Pasteur de Strasbourg) i Instituta za demografiju Univerziteta Marc Bloch u Strasbourg-u (Institut de démographie de l’Université Marc Bloch de Strasbourg). Ova knjiga je koncipirana prema nastavnom programu predmeta Statistika u ekonomiji i menadžmentu koji se izučava na prvoj godini Ekonomskog fakulteta u Sarajevu. Sastavljena je iz šest poglavlja sa sljedećim naslovima: Statistika i statistička istraživanja, Analiza i sinteza podataka, Regresiona i korelaciona analiza, Dinamička analiza i mjerenje evolucije, Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće te Teorija i metode uzoraka i statističko zaključivanje. U svakom poglavlju su definisani, analizirani i formalizirani osnovni pojmovi i kategorije koji su zatim aplicirani na konkretnim primjerima. Aplikacija analiziranih metoda je vršena na statističkim podacima objavljenim u publikacijama Federalnog zavoda za statistiku Bosne i Hercegovine, Agencije za statistiku Bosne i Hercegovine i Nacionalnog instituta za statistiku i ekonomske studije (INSEE) Francuske. Na kraju svakog poglavlja su prezentovani lista

5

teorijskih pitanja, riješeni zadaci i zadaci sa elementima rješenja. U prilogu su date tablice teorijskih distribucija vjerovatnoće. Posebnu zahvalnost izražavam recenzentima prof. dr Divni Janković i prof. dr Želimiru Vučkoviću čije su primjedbe i prijedlozi doprinijeli poboljšanju teksta. Autor je odgovoran za eventualne greške i propuste. Zahvaljujem i mojim saradnicama posebno mr Emini Resić, koja je pažljivo pročitala tekst, pripremila tablice u prilogu, i u svim fazama izrade ovog udžbenika mi pružila veliku pomoć, kao i Adeli Delalić i Almiri ArnautBerilo. Svim ostalim koji su doprinijeli da ova knjiga bude napisana i objavljena iskreno zahvaljujem. Knjigu posvećujem mojoj majci za 99. rođendan i za njenu beskrajnu ljubav, plemenitost i dobrotu. Nadam se da će ova knjiga zadovoljiti potrebe studenata i svih onih koji koriste statističke metode u svom radu. Unaprijed zahvaljujem za sve primjedbe, sugestije i konstruktivne kritike koje bi mogle poboljšati prezentovani tekst. Sarajevo, aprila 2006.g. Prof. dr Rabija Somun-Kapetanović

PREDGOVOR DRUGOM IZDANJU Zadovoljstvo mi je prezentovati drugo izdanje knjige „Statistika u ekonomiji i menadžmentu“. U ovom izdanju su izvršene određene izmjene, dopune i korekcije teksta prvog izdanja. Zahvaljujem mojim saradnicima mr Emini Resić, Adeli Delalić i Ademiru Abdiću koji su svojim sugestijama doprinijeli poboljšanju teksta za drugo izdanje ove knjige. Sarajevo, marta 2008. godine Prof. dr Rabija Somun-Kapetanović

6

SADRŽAJ POGLAVLJE 1. STATISTIKA I STATISTIČKA ISTRAŽIVANJA

15

1.1.

15

POJAM STATISTIKE

1.2. NAUČNI PRISTUP STATISTIČKOM ISTRAŽIVANJU 1.2.1. Prikupljanje podataka 1.2.1.1. Metode prikupljanja podataka 1.2.2. Obrada podataka

17 17 17 19

1.3. STATISTIČKI SKUP I STATISTIČKE VARIJABLE 1.3.1. Statistički skup i njegove karakteristike 1.3.2. Pojam, proces mjerenja i karakteristike statističke varijable 1.3.2.1. Nominalna skala 1.3.2.2. Ordinalna skala 1.3.2.3. Intervalna skala 1.3.2.4. Metrička skala 1.3.3. Primjer projekta istraživanja 1.3.4. Statistički pojmovi i definicije 1.3.5. Prezentacija statističkih podataka 1.3.5.1. Tabelarna prezentacija 1.3.5.2. Grafička prezentacija

19 19 20 21 21 22 22 22 23 25 28 31

POGLAVLJE 2. ANALIZA I SINTEZA PODATAKA

39

2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 2.1.1. Definicije 2.1.2. Formalizacija definicija

39 39 40

2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI 2.2.1. Kvalitativne varijable 2.2.1.1. Kvalitativna nominalna varijabla 2.2.1.2. Kvalitativna ordinalna varijabla 2.2.2. Kvantitativne varijable 2.2.2.1. Kvantitativna prekidna varijabla 2.2.2.2. Kvantitativna neprekidna varijabla

44 44 44 45 45 45 45

2.3.

45

GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE

7

2.4. 2.4.1.

2.4.2. 2.4.3. 2.4.4. 2.4.5. 2.4.6.

2.4.7.

MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Aritmetička sredina 2.4.1.1. Jednostavna aritmetička sredina 2.4.1.2. Ponderisana aritmetička sredina 2.4.1.3. Osobine aritmetičke sredine Geometrijska sredina Harmonijska sredina Kvadratna i kubna sredina Mod ili centar aktivnosti Medijana ili centar pozicije 2.4.6.1. Određivanje medijane u uređenoj seriji 2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija 2.4.6.3. Medijana i kumulativna frekvencija 2.4.6.4. Karakteristike medijane Kvantili 2.4.7.1. Određivanje kvantila u uređenoj seriji 2.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji 2.4.7.3. Kvartili 2.4.7.4. Decili 2.4.6.5. Centili

47 48 48 49 50 53 54 55 56 58 58 59 60 62 62 62 63 63 65 65

2.5. MJERE DISPERZIJE ILI VARIJACIJE 2.5.1. Apsolutne mjere disperzije 2.5.1.1. Raspon varijacije 2.5.1.2. Interkvantilno apsolutno odstupanje 2.5.1.3. Box Plot 2.5.1.4. Srednje apsolutno odstupanje 2.5.1.5. Varijansa 2.5.1.6. Standardna devijacija 2.5.2. Relativne mjere disperzije 2.5.2.1. Interkvantilna relativna odstupanja 2.5.2.2. Koeficijent kvartilne devijacije 2.5.2.3. Koeficijent varijacije 2.5.2.4. Standardizovane varijable 2.5.3. Čebiševa teorema 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije 2.5.5. Pregled mjera srednje vrijednosti i varijacije

66 67 67 67 67 69 71 74 75 75 76 76 76 77 78 79

2.6. 2.6.1. 2.6.2. 2.6.3.

80 80 81 84

8

MJERE OBLIKA DISTRIBUCIJE Momenti distribucije frekvencija Mjere asimetrije Parametri spljoštenosti

2.7. MJERE KONCENTRACIJE 2.7.1. Lorenzova kriva 2.7.2. Ginijev koeficijent 2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova 2.7.3. Medijala

87 87 91 92 93 95

2.8. 2.9.

96 98

TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA

POGLAVLJE 3. REGRESIONA I KORELACIONA ANALIZA

111

3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI 3.1.1. Etape konstrukcije modela 3.1.1.1. Dijagram (oblak) rasipanja

111 112 112

3.2.

KOVARIJANSA

113

3.3. 3.3.1. 3.3.2. 3.3.3.

REGRESIONA ANALIZA Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavke o osobinama stohastičnosti modela Aplikacija analiziranih metoda

116 117 120 121

3.4.

MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Koeficijent determinacije Koeficijent korelacije Standardna greška regresionog modela Koeficijent varijacije regresionog modela Aplikacija različitih oblika regresionog modela 3.4.5.1. Linearni model 3.4.5.2. Eksponencijalni model 3.4.5.3. Stepeni model 3.4.5.4. Logaritamski model Spearmanov koeficijent korelacije ranga

126 126 128 129 130 130 131 134 135 135 140

3.4.1. 3.4.2. 3.4.3. 3.4.4. 3.4.5.

3.4.6.

3.5. MODEL VIŠESTRUKE REGRESIJE 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica 3.5.2. Analiza numeričkog primjera

141 142

3.6. 3.7.

145 146

TEORIJSKA PITANJA RIJEŠENI ZADACI

140

9

POGLAVLJE 4. DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE

153

4.1.

153

APSOLUTNA I RELATIVNA PROMJENA

4.2. INDEKSI 4.2.1. Individualni indeksi 4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) 2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) 4.2.2. Osobine indeksa 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne 4.2.3.2. Pretvaranje baznih u lančane indekse 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu 4.2.4. Agregatni indeksi 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina 4.2.4.3. Formule za računanje i osobine agregatnih indeksa 4.2.4.4. Fischerov indeks cijena 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija 4.2.4.6. Inflacija i deflator

160 161 162

4.3. VREMENSKE (HRONOLOŠKE) SERIJE 4.3.1. Konstitutivni elementi vremenske serije 4.3.2. Metod pokretnih sredina za određivanje trenda 4.3.2.1. Određivanje tendencije metodom pokretnih sredina neparnog reda 4.3.2.2. Određivanje tendencije metodom pokretnih sredina parnog reda 4.3.3. Aditivni model 4.3.4. Multiplikativni model 4.3.5. Metod najmanjih kvadrata za određivanje dugoročne tendencije (trenda) 4.3.5.1. Linearni trend 4.3.5.2. Parabolični trend 4.3.5.3. Eksponencijalni trend

193 194 195

4.4. 4.5.

209 210

10

TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA

164 171 181 181 182 182 183 185 187 188 191 191 192

196 198 202 202 203 204 207 208

POGLAVLJE 5. OSNOVI VJEROVATNOĆE I TEORIJSKE DISTRIBUCIJE VJEROVATNOĆE 5.1. Uloga i značaj eksperimenta u statistici 5.1.1. Slučajni eksperiment, skup mogućih rezultata eksperimenta i događaji 5.1.1.1. Vrste događaja 5.1.1.2. Osobine skupova 5.2. 5.2.1. 5.2.2. 5.2.3.

5.2.4.

5.2.5. 5.2.6. 5.2.7.

5.2.8.

DEFINISANJE VJEROVATNOĆE Eksperimentalni pristup definisanju vjerovatnoće Teorijska definicija vjerovatnoće Teoreme vjerovatnoće 5.2.3.1. Teorema aditivnosti 5.2.3.2. Teorema multiplikativnosti 5.2.3.3. Uslovna vjerovatnoća i nezavisnost slučajnih događaja 5.2.3.4. Bayesova teorema Kombinatorika 5.2.4.1. Permutacije 5.2.4.2. Kombinacije 5.2.4.3. Varijacije Slučajna ili stohastička varijabla 5.2.5.1. Prekidna slučajna varijabla 5.2.5.2. Neprekidna slučajna varijabla Čebiševa teorema Prekidne distribucije (zakoni, rasporedi) vjerovatnoće 5.2.7.1. Uniformni zakon vjerovatnoće 5.2.7.2. Bernoullijeva distribucija vjerovatnoće 5.2.7.3. Binomna distribucija vjerovatnoće 5.2.7.4. Poissonova distribucija vjerovatnoće 5.2.7.5. Hipergeometrijska distribucija vjerovatnoće 5.2.7.6. Tabelarni pregled prekidnih distribucija Neprekidne distribucije vjerovatnoće 5.2.8.1. Neprekidna uniformna distribucija 5.2.8.2. Normalna distribucija vjerovatnoće ili Laplace-Gaussova distribucija 5.2.8.3. Aproksimacije distribucija vjerovatnoće 5.2.8.4. Hi-kvadrat χ 2 distribucija 5.2.8.5. Studentova t distribucija 5.2.8.6. Ficher-Snedecorova (F) distribucija 5.2.8.7. Tabelarni pregled neprekidnih distribucija vjerovatnoće 5.2.8.8. Centralna granična teorema

( )

229 229 230 232 235 235 236 237 239 239 240 240 241 244 244 244 245 245 246 250 252 253 253 255 257 261 266 266 267 267 269 279 283 285 288 290 290

11

5.3. 5.4.

5.2.8.9. Šematski prikaz prekidnih i neprekidnih distribucija vjerovatnoće

291

TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA

292 293

POGLAVLJE 6. TEORIJA I METODA UZORAKA I STATISTIČKO ZAKLJUČIVANJE

305

6.1. OSNOVE TEORIJE UZORAKA 6.2. VRSTE UZORKA I METODE ZA IZBOR UZORKA 6.2.1. Slučajni uzorci 6.2.1.1. Jednostavni slučajni uzorak 6.2.1.2. Sistematski uzorak 6.2.1.3. Uzorak sa nejednakom vjerovatnoćom izbora jedinica 6.2.1.4. Stratifikovani uzorak 6.2.1.5. Uzorak skupina 6.2.1.6. Višestepeni uzorak 6.2.1.7. Višefazni uzorci 6.2.1.8. Panel uzorak 6.2.1.9. Namjerni uzorci

306 311 311 312 315 316 317 317 318 319 320 320

6.3.

PROCJENE OBILJEŽJA OSNOVNOG SKUPA NA OSNOVU UZORKA

6.4. ODREĐIVANJE INTERVALA POVJERENJA 6.4.1. Intervalna procjena aritmetičke sredine osnovnog skupa 6.4.1.1. Intervalna procjena aritmetičke sredine osnovnog skupa čija je varijansa poznata 6.4.1.2. Procjena intervala aritmetičke sredine osnovnog skupa čija je varijansa nepoznata 6.4.1.3. Interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata 6.4.2. Procjena intervala povjerenja za proporciju 6.4.3. Intervalna procjena standardne devijacije i varijanse osnovnog skupa 6.4.3.1. Intervalna procjena standardne devijacije 6.4.3.2. Intervalna procjena varijanse osnovnog skupa pomoću hi-kvadrat distribucije na osnovu poznate varijanse malog uzorka 6.4.3.3. Interval povjerenja za varijansu velikog uzorka 6.4.4. Interval povjerenja totala osnovnog skupa 6.4.5. Interval povjerenja za medijanu

12

321 327 327 327 331 332 334 336 336 337 337 338 338

6.4.6. Ocjena intervala za parametre modela linearne regresije 6.4.7. Intervalna procjena koeficijenta korelacije

339 340

6.5. TESTIRANJE HIPOTEZA 6.5.1. Formulisanje hipoteza 6.5.1.1. Donošenje odluke i greške tipa I i II 6.5.1.2. Empirijski nivo značajnosti p-vrijednost 6.5.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa 6.5.2.1. Varijansa osnovnog skupa poznata 6.5.2.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n ≥30 6.5.2.3. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n, =, xmax (2.4)

S ( xi ) ≤ S ( x j ),

xi < x j

j-ti član kumulativne rastuće distribucije relativnih frekvencija izražavamo u sljedećem obliku: j

F ( x j ) = ∑ pi , j = 1, 2,..., k , i =1

F ( x j ) = p( X ≤ x j )

(2.5)

Osobine rastuće kumulativne distribucije sa relativnim frekvencijama su:

⎧0 , ⎪ F ( x j ) = ⎨0 ≤ F ( x j ) ≤ 1, ⎪ , ⎩1

x j < xmin xmin ≤ x j ≤ xmax x j > xmax (2.6)

F ( xi ) ≤ F ( x j ),

xi < x j

Objašnjenje vrijednosti kumulativne distribucije frekvencija proizilazi iz načina njenog formiranja. S(xj) predstavlja broj modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj. Analognim postupkom kompletiramo izraz za kumulativnu distribuciju relativnih frekvencija. Kumulativna distribucija relativnih frekvencija F(xj) pokazuje proporciju modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj.

41

Statistika u ekonomiji i menadžmentu

Prema definiciji, zbir kumulativne rastuće relativne frekvencije jednog modaliteta i kumulativne opadajuće relativne frekvencije istog modaliteta je jednak jedinici (ili 100%). Ako je data distribucija frekvencija sa intervalima S(xj) predstavlja broj modaliteta sa vrijednošću varijable koja je jednaka ili manja od gornje granice j-tog intervala, a F(xj) proporciju modaliteta čija je vrijednost jednaka ili manja od gornje granice j-tog intervala. Na sljedećem primjeru ćemo kompletirati kumulativnu rastuću relativnu frekvenciju i objasniti njeno značenje. Primjer 2.1. Tabela 2.1. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004.g. Broj soba 1 2 3 4 5 Ukupno

Frekvencija fj 184 238 115 35 2 574

Relativna frekvencija pj 0,321 0,415 0,200 0,061 0,003 1

Kumulativna rastuća relativna frekvencija Fj 0,321 0,736 0,936 0,997 1 -

Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.

U našem primjeru kumulativna frekvencija za broj soba manje ili jednako tri je jednaka 93,6%. Dakle, F(3)=93,6%, što znači da 93,6% završenih stanova u Federaciji Bosne i Hercegovine u 2004. g. ima 1, 2, ili 3 sobe. Na primjeru sljedeće distribucije frekvencija ćemo ilustrovati izračunavanje kumulativnih frekvencija i njihov grafički prikaz.

42

Poglavlje 2. – Analiza i sinteza podataka

Primjer 2.2. Tabela 2.2. Statistička distribucija frekvencija ocjena na ispitu iz predmeta Statistika Ocjena xj 6 7 8 9 10 Ukupno

fj 4 8 7 6 9 34

Sj + 4 12 19 25 34

Sj 30 22 15 9 0

pj 0,118 0,235 0,206 0,176 0,265 1,000

Fj+ 0,118 0,353 0,559 0,735 1

Fj 0,882 0,647 0,441 0,264 0,000

U tabeli Sj+ i Sj predstavljaju rastuće i opadajuće apsolutne kumulativne frekvencije, a Fj+ i Fj rastuće i opadajuće relativne kumulativne frekvencije.

Apsolutne frekvencije

35

Sj+

Sj-

30 25 20 15 10 5 0 6

Grafikon 2.1.

7

Ocjene

8

9

10

Kumulativne rastuce i opadajuce apsolutne frekvencije

43

Statistika u ekonomiji i menadžmentu

relativne frekvencije

1

Fj+

Fj -

0.8 0.6 0.4 0.2 0

6

Grafikon 2.2.

7

8

9

10 ocjene

Kumulativne rastuce i opadajuce relativne frekvencije

2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI Mi smo već u uvodnom dijelu naglasili da je osnovna dihotomija statističkih varijabli na kvalitativne i kvantitativne varijable. Modaliteti jedne varijable određuju njen tip. 2.2.1. Kvalitativne varijable Varijabla je kvalitativna ako se njeni modaliteti ne mogu kvantitativno izraziti. Modaliteti ove varijable su deskriptivno izraženi kao atributivna ili geografska obilježja. Naprimjer pol, bračno stanje, zaposleni prema stepenu stručnog obrazovanja, tip stana su kvalitativne varijable. Postoje dvije grupe kvalitativnih varijabli. To su kvalitativna nominalna i kvalitativna ordinalna varijabla. 2.2.1.1. Kvalitativna nominalna varijabla Varijabla je kvalitativna nominalna ako su njeni modaliteti dati u obliku atributivnih ili geografskih obilježja koje nije moguće klasirati prema nekom redosljedu (rangu) koji ima smisla. Naprimjer, varijabla «pol» čija dva modaliteta su: žena i muškarac. Kvalitativne varijable se mogu kodirati. Numeričko kodiranje npr. 1 za «ženu» i 2 za «muškarca» je arbitrarno i nikakve matematičke operacije sa kodiranim vrijednostima nisu dozvoljene. 44

Poglavlje 2. – Analiza i sinteza podataka

2.2.1.2. Kvalitativna ordinalna varijabla Varijabla je kvalitativna ordinalna ako je moguće klasirati njene modalitete prema nekom redosljedu koji ima smisla. Naprimjer, varijabla ocjena izražena sljedećim modalitetima: odličan, vrlodobar, dobar, dovoljan i nedovoljan. 2.2.2. Kvantitativne varijable Varijabla je kvantitativna ako su njeni modaliteti mogu kvantificirati i ako su brojčano izraženi. Primjeri ovog tipa varijable su: broj studenata na univerzitetu, broj soba u studentskom domu, težina studenata prve godine Ekonomskog fakulteta u Sarajevu, plata u KM, broj članova porodice itd. Kvantitativne varijable se dijele na prekidne (diskretne) i neprekidne (kontinuirane). 2.2.2.1. Kvantitativna prekidna varijabla Varijabla koja može poprimiti konačan broj izolovanih, odnosno diskretno raspoređenih vrijednosti se naziva se naziva kvantitativna (numerička) prekidna varijabla. Varijabla je kvantitativna prekidna ako su njeni modaliteti prebrojivi i najčešće cjelobrojni. Prebrojavamo npr. broj studenata u amfiteatru ili broj zaposlenih na fakultetu itd. 2.2.2.2. Kvantitativna neprekidna varijabla Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta neprebrojive. Ova varijabla može uzimati bilo koju vrijednost iz intervala koji pripada skupu realnih brojeva. Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta dobijene na osnovu mjerenja. Npr.: mjerimo visinu studenata. U praksi je jednostavno odrediti da li je jedna varijabla kvalitativna nominalna ili ordinalna. Ponekad je teško odrediti da li je jedna kvantitativna varijabla prekidna ili neprekidna.

2.3. GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE Grafička prezentacija koja se najčešće koristi u slučaju prekidne varijable je dijagram sa stupcima. Najznačajnija grafička prezentacija kontinuirane varijable je histogram. U slučaju serije intervalno grupisanih podataka sa 45

Statistika u ekonomiji i menadžmentu

jednakom amplitudom intervala, visina pravougaonika koji čine histogram je proporcionalna frekvenciji svakog intervala. Za seriju intervalno grupisanih podataka sa različitom amplitudom svakog intervala potrebno je izračunati frekvencije po jedinici amplitude koje nazivamo korigovane frekvencije i u tom slučaju površina svakog pravougaonika je proporcionalna frekvenciji intervala. Na prva dva grafikona ilustrujemo grafičko predstavljanje kvantitativne prekidne varijable. Ovu varijablu predstavljamo dijagramom sa stupcima na grafikonu 2.3. i njenu kumulativnu krivu na grafikonu 2.4.

x Grafikon 2.3.

Dijagram sa stupcima

1

x Grafikon 2.4.

46

Kumulativna kriva prekidne varijable

Poglavlje 2. – Analiza i sinteza podataka

Kvantitativnu neprekidnu varijablu predstavljamo histogramom i kumulativnom krivom. Histogram je predstavljen na grafikonu 2.5., a kumulativna kriva na grafikonu 2.6.

x Grafikon 2.5.

Histogram

x Grafikon 2.6.

Kumulativna kriva

2.4. MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Mjere srednje vrijednosti mogu biti potpune (izračunate, izvedene) i pozicione (položajne, nepotpune). U potpune mjere srednje vrijednosti 47

Statistika u ekonomiji i menadžmentu

ubrajamo aritmetičku, geometrijsku, harmonijsku, kvadratnu i kubnu sredinu. Pozicione mjere srednje vrijednosti su: mod, medijana i kvantili. 2.4.1. Aritmetička sredina Aritmetička sredina je prosječna srednja vrijednost. Aritmetička sredina jedne statističke serije je jednaka zbiru opservacija podijeljenim sa veličinom serije. Aritmetička sredina izražava prosječnu vrijednost jedne serije ili distribucije podataka i predstavlja najznačajniju mjeru centralne tendencije. 2.4.1.1. Jednostavna aritmetička sredina •

Aritmetička sredina negrupisane (neuređene) serije {xi; i = 1,...., N} se utvrđuje koristeći sljedeći izraz: x=

1 N

N

∑x

i

=

i =1

1 ( x1 + x2 ...... + xN ) N

(2.7)

Za seriju:

{xi } = { 2,0,10,8,4,0,6,4,6,2,6} , {xi; i=1,....,11} aritmetička sredina je jednaka

x= •

2 + 0 + 10 + 8 + 4 + 0 + 6 + 4 + 6 + 2 + 6 = 4,36 11

Aritmetička sredina uređene serije {x(i); (i)=1,..., N} gdje (i) predstavlja rang opservacije je jednaka: x=

1 N

N

∑x

i

i =1

=

1 ( x1 + x2 ...... + xN ) N

Za seriju:

{xi } = {0,0,2,2,4,4,6,6,6,8,10} , {x(i); (i)=1,....,11} aritmetička sredina je: 48

(2.8)

Poglavlje 2. – Analiza i sinteza podataka

x=

0 + 0 + 2 + 2 + 4 + 4 + 6 + 6 + 6 + 8 + 10 48 = = 4,36 11 11

2.4.1.2. Ponderisana aritmetička sredina •

Ponderisana

{( x ; f ) , j

aritmetička

j = 1, 2,...., J

j

}

sredina

grupisane

statističke

serije

gdje fj predstavlja frekvenciju modaliteta xj

je jednaka:

x=

1 N

J

∑f j =1

⋅ xj =

j

( f1 ⋅ x1 + f 2 ⋅ x2 + ... + f J ⋅ xJ )

(2.9)

N

Za seriju {( 0 ; 2 ), ( 2 ; 2 ), ( 4 ; 2 ), ( 6 ; 3 ), ( 8 ;1 ), ( 10 ;1 ) } , u kojoj su dati parovi u kojima prvi broj predstavlja modalitet a drugi frekvenciju, aritmetička sredina je jednaka: 6

x= x= •

∑f

j

j =1

xj

f1 x1 + f 2 x 2 + f 3 x3 + f 4 x 4 + f 5 x5 + f 6 x6 f1 + f 2 + f 3 + f 4 + f 5 + f 6

=

N

2 ⋅ 0 + 2 ⋅ 2 + 2 ⋅ 4 + 3 ⋅ 6 + 1 ⋅ 8 + 1 ⋅ 10 = 4,36 2 + 2 + 2 + 3 +1+1

Aritmetička sredina statističke serije sa relativnim frekvencijama je jednaka: J

x = ∑ p j x j gdje je p j = j =1

i

J

∑p j =1



j

fj N

(2.10)

=1

Aritmetička sredina statističke serije grupisane u intervale se utvrđuje primjenom sljedećeg izraza:

x=

1 N

J

∑f j =1

j

⋅ xc j =

( f ⋅x 1

c1

+ f 2 ⋅ xc2 + ... + f J ⋅ xcJ N

)

(2.11)

gdje xc predstavlja centar intervala i izračunava se pomoću sljedećeg izraza: 49

Statistika u ekonomiji i menadžmentu

xcj =

x j −1 + x j

(2.12)

2

(2; 2), (4 ; 2), (6 ; 3), (8;1), (10;1)} grupisanu u intervale predstavljamo u sljedećoj tabeli. Seriju

{(0 ; 2),

Tabela 2.3. Intervalno grupisana distribucija Intervali 0-2 4-6 8-10 Ukupno

Frekvencija 4 5 2 11

x≈

Centri razreda 1 5 9 -

4 ⋅1 + 5 ⋅ 5 + 2 ⋅ 9 = 4,27 11

Za izračunavanje aritmetičke sredine je potrebno primijeniti odgovarajuću formulu u zavisnosti od raspoloživih podataka. Aritmetičku sredinu možemo nazvati i centrom gravitacije, centrom koji predstavlja prosječnu vrijednost posmatrane serije kojoj teže, gravitiraju ostale vrijednosti u seriji. Aritmetička sredina izravnava apsolutne razlike između svih podataka u analiziranom skupu. Aritmetičku sredinu možemo računati samo za kvantitativne varijable. Dakle, za statističku seriju čije su varijable mjerene na nominalnoj i ordinalnoj skali ne možemo računati aritmetičku sredinu. 2.4.1.3. Osobine aritmetičke sredine •

Ako su vrijednosti svih obilježja u seriji jednake konstanti i aritmetička sredina je jednaka toj konstanti c:

x1 = x2 = .... = xN = c ⇒ x = c x=

50

1 N

N

∑ xi = i =1

1 N

N

1

∑ c = N ⋅ Nc = c i =1

(2.13)

Poglavlje 2. – Analiza i sinteza podataka



Aritmetička sredina je rijetko jednaka jednoj od posmatranih vrijednosti, ali promjena vrijednosti samo jednog modaliteta značajno utiče na aritmetičku sredinu. Zbog toga je aritmetička sredina vrlo osjetljiva na ekstremne vrijednosti posmatrane varijable. U računanju aritmetičke sredine uzimaju se vrijednosti svih modaliteta.



Aritmetička sredina je veća od najmanje i manja od najveće vrijednosti varijable3:

min xi < x < max xi •

(2.14)

Zbir odstupanja između modaliteta i njihove aritmetičke sredine je jednak nuli. N

N

i =1

i =1

∑ ( xi − x ) = ∑ xi − N ⋅ x = 0

(2.15)

Po analogiji, možemo pokazati da je zbir odstupanja svih vrijednosti obilježja od njihove aritmetičke sredine jednak nuli i za grupisane podatke. J

∑ f (x j =1

j

j

− x) = 0

(2.16)

Posljedica navedene osobine je sljedeća: aritmetička sredina odstupanja između opservacija i njihove aritmetičke sredine je jednaka nuli.

1 N

N

∑( x i =1

i

− x) = 0

(2.17)

Ova osobina vrijedi i u slučaju grupisanih podataka. •

Osobina agregiranja aritmetičke sredine

Ako na osnovu varijable X analiziramo populaciju veličine N sastavljenu od potpopulacije veličine N1, odgovarajuće aritmetičke sredine x1 i potpopulacije veličine N2, i njene aritmetičke sredine x2 . Aritmetička sredina varijable X za populaciju se dobija korištenjem sljedećeg izraza:

3

Izuzetak je slučaj kada su vrijednosti svih obilježja u seriji jednake konstanti, pa je i aritmetička sredina niza jednaka toj konstanti.

51

Statistika u ekonomiji i menadžmentu

x=

N1 x1 + N 2 x 2 f x + f 2 x2 = 1 1 N1 + N 2 f1 + f 2

(2.18)

Ova osobina se može generalizirati na n potpopulacija. Ilustraciju ove osobine ćemo pokazati na sljedećem primjeru. Tabela 2.4. Godišnje neto plate državnih službenika u 2000. godini Službenici

Frekvencija u hiljadama fj

Kategorija A Kategorija B Kategorija C Ukupno

Prosječna godišnja neto plata u eurima x

769,6 300,7 469,9 1540,2

29 549 21 698 17 576 ?

Izvor: Tableau de l’economie francaise (TEF), 2002-2003, INSEE, strana 93.

Prosječna godišnja neto plata svih službenika:

x= •

N1 x1 + N 2 x2 + N 3 x3 = 24 363,4€ N1 + N 2 + N 3

Aritmetička sredina zbira statističkih varijabli

Ovu osobinu ćemo ilustrovati na primjeru zbira dvije statističke varijable. Posmatrajmo za N domaćinstava podatke o njihovoj potrošnji ci i njihovoj štednji ši. Ako budžet domaćinstva i označimo sa bi za svako i možemo kompletirati sljedeću relaciju4:

bi = ci + ši ⇒ B = C + Š

b=

1 N

N

∑ bi = i =1

1 N

N

∑ (ci + ši ) = i =1

1 N

N

∑ ci + i =1

1 N

N

∑š i =1

i

=c +š

(2.19)

Aritmetička sredina zbira dvije statističke varijable je jednaka zbiru aritmetičkih sredina te dvije varijable. Dakle, ako imamo jednu statističku 4

52

Za označavanje modaliteta ili vrijednosti varijabli koristimo mala slova, a za označavanje statističkih varijabli koristimo velika slova.

Poglavlje 2. – Analiza i sinteza podataka

varijablu izraženu u obliku zbira dvije statističke varijable, njena aritmetička sredina je jednaka zbiru aritmetičkih sredina te dvije varijable. Ako je Z=X+Y, aritmetička sredina varijable Z je jednaka zbiru aritmetičkih sredina varijabli X i Y:

z=x+y

(2.20)

Ovu osobinu možemo generalizirati i zaključiti da je aritmetička sredina zbira n statističkih varijabli jednaka zbiru aritmetičkih sredina n statističkih varijabli. •

Aritmetička sredina linearne kombinacije statističkih varijabli

Linearnu kombinaciju statističkih varijabli definišemo sljedećom relacijom: yi = a + bxi

(2.21)

gdje su a i b parametri. Gornju relaciju možemo napisati u obliku Y = a+bX čija je aritmetička sredina jednaka:

y = a + bx

(2.22)

Navedenu osobinu možemo objasniti na sljedeći način. Ako sve opservacije pomnožimo jednim brojem tada će i aritmetička sredina biti pomnožena tim brojem. Ukoliko dodamo određeni broj svim opservacijama jedne serije, aritmetička sredina će biti uvećana za taj broj. Kada pomnožimo sve ocjene iz jednog predmeta sa 2 tada će i aritmetička sredina ocjena iz tog predmeta biti pomnožena sa 2. Ako dodamo 5 poena svim ocjenama iz jednog predmeta, aritmetička sredina ocjena iz tog predmeta se uvećava za 5 poena. Na ovaj način definisane su osobine aditivnosti i linearnosti aritmetičke sredine. Posebnu pažnju treba obratiti na izračunavanje aritmetičke sredine u slučaju intervalno grupisane distribucije sa stvarnim intervalima. 2.4.2. Geometrijska sredina Geometrijska sredina za serije negrupisanih podataka je jednaka N- tom korijenu iz proizvoda vrijednosti varijable i izračunava se prema sljedećoj formuli: 53

Statistika u ekonomiji i menadžmentu N

G = N x1 ⋅ x2 ⋅ .... ⋅ x N = N ∏ xi , xi > 0 , i = 1, N

(2.23)

i =1

Za izračunavanje geometrijske sredine jedne serije koriste se svi podaci i potrebno je da budu pozitivni. Logaritamski oblik ove funkcije praktičniji za primjenu dat je sljedećim izrazom:

log G =

1 N

N

∑ log x i =1

(2.24)

i

Konstatujemo da je logaritam geometrijske sredine varijable X jednak aritmetičkoj sredini logaritama njenih vrijednosti. Geometrijska sredina statističke distribucije frekvencije je jednaka: J

J

G = N x1f1 ⋅ x2f2 ⋅ .... ⋅ xJf J = N ∏ x j j , N = ∑ f J , x j > 0, j = 1, J f

j =1

(2.25)

j =1

Logaritamski oblik ponderisane geometrijske sredine je izražen sljedećom relacijom:

log G =

J 1 J log , f x N = fj ∑ j j ∑ N j =1 j =1

(2.26)

Geometrijska sredina se najčešće primjenjuje u slučajevima kada se pojave ponašaju po geometrijskoj progresiji, za izračunavanje prosječnih pokazatelja porasta i razvoja u dinamičkoj analizi pojava, za izračunavanje srednje vrijednosti vremenskih serija i kod lančanih indeksa. Geometrijska sredina izravnava odnose, tj. proporcionalne promjene između uzastopnih podataka u analiziranoj seriji. 2.4.3. Harmonijska sredina Harmonijska sredina se definiše kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti varijable X. Harmonijska sredina za seriju negrupisanih podataka se izračuna pomoću sljedećeg izraza:

54

Poglavlje 2. – Analiza i sinteza podataka

H=

N

=

N

1 ∑ i =1 xi

N 1 1 1 1 + + ... + + ... + x1 x2 xi xN

, xi ≠ 0

(2.27)

Harmonijska sredina za statističku distribuciju frekvencija je data izrazom: J

H=

∑ j =1 J

∑ j =1

J

fj

f + f 2 + ... + fi + ... + f J + = 1 = fi fJ f1 f 2 fj + + ... + + ... + x1 x2 xi xJ xj

∑f j =1 J

fj

∑x j =1

j

, xj ≠ 0

(2.28)

j

Postupak izračunavanja ove sredine je jednostavan. Poteškoća je u uočavanju slučajeva u kojima se može primijeniti. Izračunava se u slučaju kada su originalni podaci izraženi u vidu recipročnih veličina. Recipročne veličine se kreću u obrnutom pravcu od kretanja pojave koju izražavaju. Produktivnost rada je tipičan primjer primjene ove sredine jer veća produktivnost rada znači veću proizvodnju uz manji utrošak rada. Ako su sve vrijednosti varijable pozitivne, vrijedi sljedeća relacija odnosa izmedu tri analizirane potpune mjere srednje vrijednosti: min xi ≤ H ≤ G ≤ x < max xi

(2.29)

2.4.4. Kvadratna i kubna sredina Kvadratna sredina se izražava u sljedećem obliku: N

∑x

x2 =

2 i

i =1

(2.30)

N

Kubna sredina je data sljedećim izrazom: N

x3 =

3

∑x i =1

3 i

N

(2.31)

Odnos između pet prezentiranih sredina je sljedeći: min xi ≤ H ≤ G ≤ x ≤ x 2 ≤ x 3 < max xi

(2.32)

55

Statistika u ekonomiji i menadžmentu

2.4.5. Mod ili centar aktivnosti Mod je jedna od najstarijih pozicionih vrijednosti koja se jednostavno utvrđuje. Mod se definiše kao modalitet varijable koji se najčešće pojavljuje, tj. modalitet koji ima najveću frekvenciju. Najčešći su slučajevi unimodalnih serija. Međutim, potrebno je naglasiti da serija može biti bimodalna ili višemodalna ukoliko se u jednoj seriji nalazi više modaliteta koji imaju najvišu frekvenciju. Primjer 2.3. Određivanje moda Tabela 2.5. Nastavnici sa punim radnim vremenom na visokoškolskim ustanovama u Federaciji Bosne i Hercegovine u 2001/2002 godini Nastavnici Redovni profesor Vanredni profesor Docent Ostali Ukupno

Frekvencije u fj 332 248 251 50 881

Izvor: Statistički godišnjak Federacije Bosne i Hercegovine, Federalni zavod za statistiku, Sarajevo, 2002.

Mod je, kao što smo već naglasili, modalitet varijable koji ima najveću frekvenciju. To je u našem primjeru modalitet redovni profesor. Grafički je vrlo jednostavno u ovom slučaju odrediti mod. 350 300 250 200 150 100 50 0

MOD

Redovni profesor Grafikon 2.7.

Vanredni profesor

Docent

Ostali

Nastavnici na visokoškolskim institucijama u Federaciji Bosne i Hercegovine u 2001/2002.

U slučaju intervalno grupisanih distribucija, poslije određivanja modalnog intervala koji ima najveću frekvenciju (ili najveću frekvenciju po jedinici 56

Poglavlje 2. – Analiza i sinteza podataka

amplitude u slučaju da intervali nemaju istu amplitudu), mod možemo izračunati linearnom interpolacijom korištenjem sljedeće formule:

M o = xMo + aMo ⋅

f 2 − f1 ( f 2 − f1 ) + ( f 2 − f 3 )

(2.33)

gdje je: xMo lijeva granica modalnog intervala,

aMo f1 f2 f3

amplituda (širina) modalnog intervala, frekvencija prethodnog intervala, frekvencija modalnog intervala, frekvencija narednog intervala.

Tabela 2.6. Starosna struktura stanovništva Federacije BiH u 2000. godini Starosna struktura xj 0-14 15-64 65 i više Ukupno

Amplituda intervala aj 15 50 26 -

Broj stanovnika fj 588 210 1 896 277 316 513 2 801 000

Gustoća intervala ili korigovana frekvencija fj / a j 39 214 37 925,5 12 173,6 -

U ovom primjeru intervali nemaju jednake amplitude pa je za utvrđivanje modalnog intervala potrebno izračunati broj stanovnika po jedinici amplitude (dijeli se frekvencija broj stanovnika sa amplitudom intervala) ili gustoću intervala da bi se odredila modalna klasa. U ovom slučaju modalna klasa je klasa od 0 do 14. U slučaju da koristimo relativne frekvencije formula je analogna gore navedenoj, osim što umjesto apsolutne frekvencije fj koristimo relativnu frekvenciju pj. Postoji i sljedeća formula pomoću koje možemo utvrditi aproksimativnu vrijednost moda u unimodalnim i nesimetričnim distribucijama: Mo ≈ 3Me-2

(2.34)

Prema ovom izrazu, mod je približno jednak tri medijane umanjene za dva. 57

Statistika u ekonomiji i menadžmentu

Modalna klasa zavisi od grupisanja u intervale koje smo prethodno izvršili. Kao i uvijek prije i poslije određivanja moda u svakom konkretnom slučaju treba se upitati: Da li ovaj pokazatelj ima smisla i da li nam omogućava ili ne dodatnu korisnu informaciju? 2.4.6. Medijana ili centar pozicije Medijana spada u pozicione srednje vrijednosti. Medijana je vrijednost obilježja koja u seriji uređenoj po veličini (rastućem ili opadajućem redosljedu) zauzima centralnu poziciju (rang) i dijeli seriju na dva jednaka dijela. Njena teorijska kumulativna frekvencija je 50%. Dakle, teorijski 50% podataka ima vrijednost manju ili jednaku medijani i preostala polovina podataka vrijednosti veće od medijane. Medijana je poziciona srednja vrijednost i za izračunavanje medijane nisu bitne vrijednosti svih podataka nego njihov rang u seriji. 2.4.6.1. Određivanje medijane u uređenoj seriji Određivanje medijane zavisi od broja podataka u seriji. Analiziraćemo slučajeve određivanja medijane ukoliko je broj podataka neparan i ukoliko je broj podataka paran. •

Neparan broj podataka

U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N neparan broj podataka, medijana se izračunava koristeći sljedeću formulu:

Me = x⎛ N +1 ⎞

(2.35)

⎜ ⎟ ⎝ 2 ⎠

Uređena statistička serija od 11 podataka: 1 2 3 4 5 6 7 8 9 42 48 53 58 60 64 68 79 88

Rang (i): Podaci (xi):

Me = x⎛ N +1 ⎞ = x ⎛ 9 +1 ⎞ = x (5) = 60 ⎜ ⎟ ⎝ 2 ⎠

58

⎜ ⎟ ⎝ 2 ⎠

Poglavlje 2. – Analiza i sinteza podataka



Paran broj podataka

U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N paran broj podataka medijana se izračunava koristeći sljedeću formulu: x⎛ N ⎞ + x⎛ N ⎞ ⎜ +1⎟ ⎝2 ⎠

⎜ ⎟ ⎝2⎠

Me =

(2.36)

2

U uređenoj seriji veličine 10: 1 2 3 4 5 6 7 8 9 10 42 48 53 58 60 64 68 79 88 90

Rang (i): Podaci (xi):

x⎛ N ⎞ + x⎛ N Me =

⎞ ⎜ +1 ⎟ ⎝ 2 ⎠

⎜ ⎟ ⎝ 2⎠

2

x⎛ 10 ⎞ + x⎛ 10 =

⎞ ⎜ +1 ⎟ ⎝ 2 ⎠

⎜ ⎟ ⎝ 2 ⎠

2

=

x(5) + x( 6) 2

=

60 + 64 = 62 2

2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija Tabela 2.7. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004. g. Broj soba xj 1 2 3 4 5 Ukupno

Frekvencije fj 184 238 115 35 2 574

Rang (i) 1 - 184 185 - 422 423 - 537 538 - 572 573 - 574

Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.

Medijana je jednaka aritmetičkoj sredini modaliteta koji zauzima rang 287 (574/2=287) i modaliteta koji zauzima rang 288.

x⎛ N ⎞ + x⎛ N Me =

⎞ ⎜ +1⎟ ⎝2 ⎠

⎜ ⎟ ⎝2⎠

2

=

x( 287 ) + x( 288) 2

=

2+2 =2 2 59

Statistika u ekonomiji i menadžmentu

U seriji grupisanoj u intervale, medijana se računa na sljedeći način:

N − S Me−1 Me = xMe + aMe ⋅ 2 f Me

(2.37)

gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala, aMe frekvencija medijanskog intervala, fMe SMe-1 kumulativna frekvencija predmedijanskog intervala, N zbir svih frekvencija. Praktičnije je računati medijanu ukoliko koristimo kumulativne relativne frekvencije:

Me = xMe + a Me ⋅ = xMe

F ( Me) − FMe−1 p Me

0,50 − FMe−1 + a Me ⋅ p Me

(2.38)

gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala aMe

FMe FMe-1 pMe

teorijska kumulativna relativna frekvencija medijane, kumulativna relativna frekvencija predmedijanskog intervala, relativna frekvencija medijanskog intervala.

Medijana se grafički može odrediti na osnovu kumulativnog dijagrama frekvencija. Kumulativnu krivu dobijemo spajanjem kumulativnih frekvencija koje odgovaraju svakom modalitetu ili u slučaju intervalno grupisanih serija gornjim granicama svakog intervala. 2.4.6.3. Medijana i kumulativna frekvencija U uređenoj seriji (klasiranoj po rastućem ili opadajućem redosljedu podataka) broj podataka koji prethode medijani je jednak broju podataka 60

Poglavlje 2. – Analiza i sinteza podataka

koji se nalaze poslije medijane. Na osnovu ove definicije mogli bismo zaključiti da je kumulativna frekvencija medijane uvijek jednaka 50 %. Provjerićemo da li je to tačno na jednom primjeru za koji smo neophodne podatke kompletirali i prezentirali u tabeli 2.8. Tabela 2.8. Određivanje kumulativne frekvencije medijane Opservacije Rang Frekvencije Kumulativne Relativne Kumulativne fi (i) frekvencije frekvencije relativne x(i) Si frekvencije pi Fi

42 48 50 52 54 58 58 58 64 68 70 Ukupno

1 2 3 4 5 6 7 8 9 10 11 -

1 1 1 1 1 1 1 1 1 1 1 11

1 2 3 4 5 6 7 8 9 10 11

0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,99≈1,00

0,09 0,18 0,27 0,36 0,45 0,54 0,63 0,72 0,81 0,90 0,99≈1,00

Me = x⎛ N +1 ⎞ = x⎛ 11+1 ⎞ = x( 6) = 58 ⎜ ⎟ ⎝ 2 ⎠

⎜ ⎟ ⎝ 2 ⎠

Konstatujemo da 5 podataka prethodi medijani koja je jednaka 58 i 5 podataka se nalazi poslije medijane. Uočavamo da se podatak 58 ponavlja tri puta i da je kumulativna rastuća frekvencija ovog modaliteta jednaka 0,72 (dakle 72%), što je znatno više od 50% koliko je teorijska kumulativna frekvencija medijane. Dakle, u slučaju kada jedna vrijednost zauzima centralni rang u seriji, ali i više ostalih rangova, odgovarajuća kumulativna frekvencija se može znatno razlikovati od teorijski pretpostavljene.

61

Statistika u ekonomiji i menadžmentu

2.4.6.4. Karakteristike medijane Medijana je parametar centralne pozicije u seriji na koju ekstremne vrijednosti nemaju uticaja jer medijana ne zavisi od vrijednosti podataka nego od njihovog ranga, pozicije u seriji. Ako su npr. greškom evidentirane neke ekstremne vrijednosti one neće uticati na medijanu. Posmatrajmo dvije uređene serije veličine 11: Rang (i): Varijabla X1: Varijabla X2:

1 2 3 4 5 6 7 8 9 10 11 42 48 50 52 54 58 59 63 74 78 80 42 48 50 52 54 58 59 63 74 78 200

U oba slučaja medijana je jednaka 58. Kako u uređenoj seriji polovina podataka prethodi medijani i polovina podataka se nalazi poslije medijane, medijana se naziva također kvantil reda 0,5 (ili reda 50%). 2.4.7. Kvantili U uređenoj seriji {x(i)} kvantil reda p koji označavamo sa xp je jednak vrijednosti varijable za koju postoji proporcija opservacija koje su jednake ili manje od xp i komplementarna proporcija (1-p) opservacija koje su veće od xp:

F (xp ) ≤ N ⋅ p

i F * ( x p ) > N (1 − p)

0 < p N (1 − p )

0 < p 1 −

1 , k >1 k2

(2.81)

Primjenu ove teoreme ilustrujemo na sljedećem primjeru. Pretpostavimo da je poznata prosječna mjesečna plata 460 eura, standardna devijacija 180 eura i k=2. Primjenom Čebiševe teoreme dobijamo: 77

Statistika u ekonomiji i menadžmentu

x ± kσ = 460 ± 2 ⋅ 80 = [300 ; 620] 1 1 1 − 2 = 1 − 2 = 75% k 2 Prema teoremi Čebiševa, najmanje 75% plata ove distribucije se nalaze u intervalu između 300 i 620 eura. Primjena ove teoreme omogućava procjenu moguće vrijednosti neke varijable i raspona varijacije u kojem se očekuje određena proporcija modaliteta. U pravilu, vrijednosti varijable rijetko odstupaju od aritmetičke sredine za više od tri standardne devijacije. Ova teorema se koristi za definisanje karakterističnih intervala u inferencijalnoj statistici. 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije Na osnovu podataka datih u tabeli 2.11. predstavit ćemo grafičku sintezu parametara pozicije i disperzije. Tabela 2.11. Distribucija neto plata u preduzećima u Francuskoj u 2000.g. grupisana prema decilima Decili

D1 D2 D3 D4 Medijana=D5 D6 D7 D8 D9

Godišnje plate u eurima xj 10 780 12 490 13 930 15 420 17 130 19 200 22 030 26 470 35 700

Kumulativne frekvencije Fj u % 10 20 30 40 50 60 70 80 90

Izvor: Tableau d’économie francaise (TEF) 2002-2003, INSEE, Paris, str. 91.

Na osnovu podataka iz tabele konstruisali smo kumulativnu krivu, grafički i analitički odredili kvartile i konstruisali box plot.

78

Poglavlje 2. – Analiza i sinteza podataka decili u % 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0

6

8

10

12

14

16

18

20

22

24

26

28

30

32

34

36

godišnje plate (u 000 €)

xmin

Grafikon 2.9.

Q1

Me

Q3

13, 210

17,130

24, 250

Kumulativna kriva godišnjih neto plata u eurima

Medijanska plata je 17130 €. To znači da je 50% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako 17130 €. Prvi kvartil Q1 je 13210 € što pokazuje da je 25% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 13210 € . Vrijednost trećeg kvartila nam daje informaciju da je 75% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 24250 €. 2.5.5. Pregled mjera srednje vrijednosti i varijacije U šemi 2.1. dajemo pregled mjera srednje vrijednosti i varijacije koje smo analizirali za kvantitativnu statističku varijablu.

79

Statistika u ekonomiji i menadžmentu

Kvantitativna varijabla

Mjere srednje vrijednosti

Potpune

Mjere varijacije

Pozicione

Apsolutne

Relativne

Aritmeticka sredina

Medijana

Raspon varijacije

Koeficijent varijacije

Geometrijska sredina

Mod

Srednje apsolutno odstupanje

Koeficijent kvartilne devijacije

Harmonijska sredina

Kvantili

Varijansa

Interkvantilna relativna odstupanja

Kvadratna sredina

Standardna devijacija

Kubna sredina

Interkvantilna odstupanja

Šema 2.1.

Interkvartilno Interdecilno Intercentilno

Mjere srednje vrijednosti i varijacije

2.6. MJERE OBLIKA DISTRIBUCIJE 2.6.1. Momenti distribucije frekvencija Za konstrukciju parametara oblika distribucije frekvencije koristimo centralne momente distribucije frekvencija koji se definišu na bazi višestepenih odstupanja vrijednosti varijable od aritmetičke sredine. Centralni moment r-tog reda je dat sljedećim izrazima: •

za negrupisanu seriju:

μr =

80

1 N

N

∑ (x − x) i

i =1

r

, r ∈ [ 0,1,..., N ]

(2.82)

Poglavlje 2. – Analiza i sinteza podataka



za statističku distribuciju frekvencija:

μr =

1 N

J

∑ f (x j

j =1

− x ) , r ∈ [ 0,1,..., N ] r

j

(2.83)

2.6.2. Mjere asimetrije Razlikuju se tri tipa distribucije: simetrična, lijevo asimetrična i desno asimetrična. Često nam analiza dijagrama u stupcima ili histograma omogućava da uočimo da li je distribucija simetrična ili ne. Analiza boxplota nam omogućava također da konstatujemo simetriju ili asimetriju distribucije. Pored navedenih, konstruisani su i specifični pokazatelji za mjerenje asimetrije koji mjere asimetriju u odnosu na pravac: x = x . Polazna veličina za mjerenje asimetrije je treći momenat oko aritmetičke sredine koji je jednak aritmetičkoj sredini odstupanja vrijednosti varijable od aritmetičke sredine podignutih na treći stepen. Za negrupisane podatke moment trećeg reda je jednak: N

μ3 =

∑ (x − x ) i =1

3

i

(2.84)

N

Za grupisanu distribuciju frekvencija treći moment oko sredine je jednak: J

μ3 =

∑ f (x j =1

j

N

j

− x)

3 J

,

N = ∑ fj

(2.85)

j =1

Analiza osobina ovog parametra omogućava da konstatujemo da je u slučaju simetrične distribucije brojnik navedenih izraza jednak nuli i treći momenat oko sredine jednak nuli. U slučaju desne asimetrije moment trećeg reda je pozitivan. Za lijevo asimetričnu distribuciju moment trećeg reda je negativan:

μ3 = 0 simetrija μ3 > 0 desna asimetrija μ3 < 0 lijeva asimetrija

(2.86)

81

Statistika u ekonomiji i menadžmentu

Moment trećeg reda zavisi od jedinica mjere u kojima je izražena varijabla i zbog toga je njegova direktna primjena otežana. Da bi otklonio taj nedostatak. Ficher je predložio sljedeći koeficijent asimetrije:

α3 =

μ3 σ3

(2.87)

Ovaj koeficijent predstavlja relativnu mjeru smjera i veličine asimetrije:

α 3 = 0 simetrija α 3 > 0 desna asimetrija α 3 < 0 lijeva asimetrija

(2.88)

Vrijednost Ficherovog koeficijenta asimetrije se najčešće nalazi u intervalu [-2;+2]. Postoje i drugi koeficijenti asimetrije koji su brži za računanje, a čije osobine proizilaze iz empirijskih iskustava. To su: •

Pearsonov koeficijent:

Sk =

x − MO

σ

(2.89)

koji je predstavljen kao standardizirano odstupanje moda od aritmetičke sredine. Najčešća vrijednost ovog koeficijenta se nalazi u intervalu [-3;+3]. Pearsonov koeficijent je nepotpuna mjera asimetrije:

S k = 0 simetrija S k > 0 desna asimetrija

(2.90)

S k < 0 lijeva asimetrija •

Koeficijent Yule i Kendall je jednak sljedećem izrazu:

Yk =

Q1 + Q3 − 2M e , - 1 ≤ Yk ≤ 1 Q3 − Q1

Yk = 0 simetrija Yk > 0 desna asimetrija Yk < 0 lijeva asimetrija 82

(2.91)

Poglavlje 2. – Analiza i sinteza podataka

Na grafikonu 2.10. je predstavljena simetrična distribucija. Kod simetrične distribucije aritmetička sredina, mod i medijana su jednaki. M0 = Me = x

fj

μ 3 = 0 ⇒ a3 = 0; Sk = 0

xj

x Grafikon 2.10.

Odnos parametara kod simetrične distribucije

Za desno asimetričnu distribuciju aritmetička sredina je veća od medijane i moda. Relativna mjera asimetrije je pozitivna.

fj

Mo < Μe < x

μ 3 > 0, ⇒ a3 > 0; Sk > 0

Mo Grafikon 2.11.

Me

x

xj

Asimetrična distribucija – desna asimetrija

Za lijevo asimetričnu distribuciju aritmetička sredina je manja od medijane i moda. Relativna mjera asimetrije je negativna.

83

Statistika u ekonomiji i menadžmentu

x < Me < Mo

μ 3 < 0 ⇒ a3 < 0; Sk < 0

fj

x Grafikon 2.12.

Me

Mo

xj

Asimetrična distribucija – lijeva asimetrija

2.6.3. Parametri spljoštenosti Konstrukcija parametara spljoštenosti je bazirana na četvrtom momentu oko sredine:

1 N 1 μ4 = N

μ4 =

N

∑(x

i

i =1 J

∑f j =1

− x)

4

j

J

(x j − x ) , N = ∑ f j 4

(2.92)

j =1

Četvrti moment oko sredine je prosječno odstupanje vrijednosti varijable od njene aritmetičke sredine podignuto na četvrti stepen. Zaobljenost se upoređuje i mjeri prema zaobljenosti modalnog vrha normalne distribucije koristeći sljedeće koeficijente: Pearsonov koeficijent zaobljenosti:

α4 =

μ4 σ4

(2.93)

Ficherov koeficijent zaobljenosti je jednak:

ϕ4 =

84

μ4 −3 σ4

(2.94)

Poglavlje 2. – Analiza i sinteza podataka

Za normalnu distribuciju koeficijenata: α 4 = 3 ⇒ ϕ4 = 0

frekvencija

vrijede

sljedeće

vrijednosti

(2.95)

Spljoštenost ostalih distribucija mjerimo u odnosu na normalnu. Ako je α 4 > 3 ⇒ ϕ 4 > 0 distribucija je uža, šiljastija od normalne, a ako je α 4 < 3 ⇒ ϕ 4 < 0 distribucija je šira, spljoštenija od normalne. Ficherov koeficijent je jednostavniji za upotrebu. Ako je distribucija šiljastija, vrijednost koeficijenta je veća. Manja vrijednost koeficijenta ukazuje na spljoštenost distribucije. Na grafikonu 2.13. su prezentovana tri tipa spljoštenosti distribucije. fj

normalna distribucija

a4 = 3; ϕ4 = 0 a4 > 3; ϕ4 > 0 a4 < 3; ϕ4 < 0

x Grafikon 2.13.

xj

Mjere spljoštenosti distribucije

Excel nam pruža mogućnost dobijanja sumarnog pregleda ocjena parametara koje smo analizirali.

85

Statistika u ekonomiji i menadžmentu

Rezultati našeg primjera ocjena na ispitu iz Statistike dobijeni u Excelu su predstavljeni u tabeli 2.12. Tabela 2.12. Output Excela za analizu ocjena na ispitu iz Statistike Descriptive Statistics Mean 8,235294118 Standard Error 0,239051988 Median 8 Mode 10 Standard Deviation 1,393900643 Sample Variance 1,942959002 Kurtosis -1,291933142 Skewness -0,09156866 Range 4 Minimum 6 Maximum 10 Sum 280 Count 34

U tabeli u prilogu je dat prijevod tabele 2.12. 86

Poglavlje 2. – Analiza i sinteza podataka

Prosječna ocjena je 8,2, medijana je 8, a ocjena koja je bila najčešća je 10. Standardna devijacija je 1,39. To znači da su u prosjeku ocjene odstupale oko aritmetičke sredine za 1,39.

2.7. MJERE KONCENTRACIJE Mjere koncentracije analiziraju način raspodjele agregatnih veličina ili globalnih vrijednosti na modalitete statističkih varijabli. Mjere koncentracije se dijele na apsolutne i relativne. Najpoznatije apsolutne mjere koncentracije su koncentracijski omjer i Herfindahlov indeks. Relativne mjere koncentracije se nazivaju i mjere nejednakosti u raspodjeli agregatnih veličina. Među najpoznatije mjere koncentracije ubrajaju se Lorenzova kriva ili kriva koncentracije i Ginijev koeficijent. Mi ćemo prezentovati i analizirati relativne mjere koncentracije. 2.7.1. Lorenzova kriva Lorenzova kriva se konstruiše u pravougaonom koordinatnom sistemu na osnovu relativnih kumulativnih frekvencija i relativne kumulativne globalne vrijednosti. Globalna vrijednost predstavlja proizvod fj xcj u kojem je fj frekvencija intervala čiji je centar xcj. Na apscisu se nanose kumulativne relativne frekvencije F j a na ordinatu relativne kumulativne globalne vrijednosti Q j . Kategorije koje koristimo u analizi mjera koncentracije formaliziramo na sljedeći način: Fj =

∑p

x≤ x j

j

; Qj =

∑q

x≤ x j

j

;

pj =

fj N

;

qj =

xj fj N

∑x j =1

j

fj

N

;

∑p j =1

j

=

N

∑q j =1

j

=1

(2.96) Dvije kumulativne frekvencije Fj i Qj variraju u intervalu [0;1]. Da bismo nacrtali Lorezovu krivu prvo konstruišemo kvadrat čije su strane jednake jedinici kao na grafikonu 2.14. Ovaj kvadrat je poznat pod imenom Ginijev kvadrat. Dijagonala kvadrata odgovara liniji jednake raspodjele. Lorenzova kriva se nalazi u trouglu čija tjemena imaju koordinate (0,0), (1,1) i (0,1). Potpuna nejednakost u raspodjeli je određena katetama trougla (0,1) i (1,1). Kada se kriva više udaljava od dijagonale koncentracija je veća i raspodjela je neravnomjernija i obrnuto. 87

Statistika u ekonomiji i menadžmentu

1

potpuna jednakost

Lorenzova kriva

potpuna nejednakost

0

1

Grafikon 2.14.

Lorenzova kriva

Na grafikonu 2.15. je predstavljena Lorenzova kriva u slučaju kada kumulativne frekvencije Fj i Qj izrazimo u procentima. 100 90 80 70 60

Q (u %)

50 40 30 20 10 0

10

20

30

40

50

60

F (u %) Grafikon 2.15.

88

Lorenzova kriva

70

80

90

100

Poglavlje 2. – Analiza i sinteza podataka

Na sljedećem primjeru ćemo ilustrovati konstrukciju Lorenzove krive. Primjer 2.5. Tabela 2.13. Dio agregiranih prihoda u % koje je primila svaka četvrtina od ukupnog broja domaćinstava u državi X. Godina 2000 2005

Broj domaćinstava 650 000 690 000

1/4 4,5 3,5

2/4 15,5 12,5

3/4 22,5 19,5

4/4 57,5 64,5

100 100

U 2000, 25% domaćinstava čiji su prihodi bili najniži su primili 4,5% agregiranih prihoda, što znači 4,5 % od ukupne mase prihoda svih 650000 domaćinstava. 50% domaćinstava sa najnižim primanjima su dobijali 20% od ukupne mase primanja svih domaćinstava, a 25% domaćinstava čiji su prihodi bili najviši su dobijali 57,5% agregiranih prihoda. U ovom slučaju koncentracija prihoda je vrlo izražena zato što jedan mali procenat domaćinstava (25%) prima veliki procenat mase ukupnih prihoda svih domaćinstava. Pokazatelji koncentracije mjere u ovom slučaju nejednakost u raspodjeli mase ukupnih prihoda domaćinstava. Nejednakost u raspodjeli ukupne mase prihoda domaćinstava se povećala u 2005.g. 25% najbogatijih domaćinstava je raspolagalo sa 64,5% mase ukupnih prihoda, a preostalih 75% domaćinstava raspolažu sa 35,5% mase ukupnih prihoda. U ovom slučaju koncentracija je jaka zato što jedan mali procenat domaćinstava prima veliki procenat mase ukupnih prihoda svih domaćinstava. Da bismo konstruisali Lorenzovu krivu za gore navedene podatke potrebno je kompletirati radnu tabelu za 2000. i za 2005. godinu: Tabela 2.14. Radna tabela za 2000. godinu Frekvencija pj u % 25 25 25 25

Agregatna primanja qj u % 4,5 15,5 25,5 54,5

Kumulativna frekvencija Fj u % 25 50 75 100

Kumulativni agregat Qj u % 4,5 20 45,5 100

89

Statistika u ekonomiji i menadžmentu

Tabela 2.15. Radna tabela za 2005. godinu Frekvencija pj u % 25 25 25 25

Agregatna primanja qj u % 3,5 12,5 19,5 64,5

Kumulativna frekvencija Fj u % 25 50 75 100

Kumulativni agregat Qj u % 3,5 16 35,5 100

Na osnovu podataka o kumulativnim frekvencijama i kumulativnom agregatu iz radnih tabela konstruisali smo Lorenzovu krivu za 2000.g. i za 2005.g.

100 2005. godina 2000. godina

Q (u %)

0

Grafikon 2.16.

F (u %)

100

Lorenzova kriva

Na osnovu položaja Lorenzovih krivih u odnosu na liniju jednake raspodjele možemo konstatovati da je došlo do porasta nejednakosti u raspodjeli mase ukupnih prihoda između domaćinstava u 2005.g. u odnosu na 2000.g.

90

Poglavlje 2. – Analiza i sinteza podataka

2.7.2. Ginijev koeficijent Ginijev koeficijent je relativna mjera koncentracije i definisan je kao odnos površine između Lorenzove krive i pravca jednake raspodjele i površine trougla koji se nalazi ispod dijagonale koja predstavlja pravac jednake raspodjele. Površina između Lorenzove krive i pravca jednake raspodjele se naziva i površina koncentracije. Ginijev koeficijent G se izračunava korištenjem sljedeće relacije:

G=

Površina koncentracije S = = 2S Površina trougla 0,5

(2.97)

Površina trougla je jednaka 0,5. Ginijev koeficijent je jednak dva puta površina koncentracije i kreće se u intervalu [0;1]. Kada je ova površina veća, nejednakost u raspodjeli je značajnija. Dva granična slučaja su vrijednosti koeficijenta jednake nuli i jedinici. Kada je Ginijev koeficijent jednak nuli, koncentracija je jednaka nuli i postoji perfektna jednakost u raspodjeli mase primanja. Ako je Ginijev koeficijent jednak jedinici koncentracija je maksimalna i postoji maksimalna nejednakost u raspodjeli ukupne mase primanja. Npr. jedna osoba prima ukupnu masu, dok ostali ne primaju ništa. Dakle, veća vrijednost Ginijevog koeficijenta odgovara većoj koncentraciji i većoj nejednakosti u raspodjeli. Ginijev koeficijent se može izračunati primjenom metode trapeza koja je praktičnija i grafički se jednostavnije ilustruje i metodom trouglova.

91

Statistika u ekonomiji i menadžmentu

2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza

100

Q (u %)

Qj

Q j −1

a

(a + c ) ⋅ h 2

F j −1

0

h

c Fj

100

F (u %) Lorenzova kriva

Grafikon 2.17.

Formula za računanje Ginijevog koeficijenta metodom trapeza: ⎡1 G = 2⋅⎢ − ⎣2 ⎡1 G = 2⋅⎢ − ⎢2 ⎣

∑ ∑

(a + c) ⋅ h ⎤ ⎥ 2 ⎦

(Q

j −1

)(

)

+ Q j ⋅ F j − F j −1 ⎤ ⎥ 2 ⎥ ⎦

G = 1 − ∑ p j ⋅ (Q j −1 + Q j )

(2.98)

Ako koristimo relativne frekvencije izražene u procentima, formula za izračunavanje Ginijevog koeficijenta je jednaka sljedećem izrazu:

92

Poglavlje 2. – Analiza i sinteza podataka

G = 1−

1 104

∑ p (Q j

j −1

+ Qj )

(2.99)

Na osnovu analiziranog primjera izračunat ćemo Ginijev koeficijent za 2000. godinu korištenjem metode trapeza. G = 1 − [ 0, 25 ⋅ (0 + 0, 045) + 0, 25 ⋅ (0, 045 + 0, 20) +

+0, 25 ⋅ (0, 20 + 0, 455) + 0, 25 ⋅ (0, 455 + 1)]

G 2000 =0,41 Ginijev koeficijent za 2000. godinu je jednak 0,41. Na isti način računamo Ginijev koeficijent za 2005. godinu:

G = 1 − [ 0, 25 ⋅ (0 + 0, 035) + 0, 25 ⋅ (0, 035 + 0,16) +

+ 0, 25 ⋅ (0,16 + 0,355) + 0, 25 ⋅ (0,355 + 1) ]

G 2005 =0,48 Ginijev koeficijent za 2005. godinu je jednak 0,48. Ginijev koeficijent u 2005.g. je veći od Ginijevog koeficijenta u 2000.g. Izračunate vrijednosti Ginijevog koeficijenta potvrđuju da je nejednakost u raspodjeli, odnosno koncentracija mase agregatnih prihoda bila veća u 2005. godini. Do istog zaključka smo došli analizirajući Lorenzovu krivu. 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova Za statističku kvantitativnu neprekidnu varijablu čiji su podaci grupisani u J intervala površina koncentracije može biti definisana kao skup J trouglova. Na tom osnovu je definisana metoda trouglova za izračunavanje Ginijevog koeficijenta prema sljedećoj formuli: J −1

G = ∑ (F j Q j +1 − F j +1Q j )

(2.100)

j =1

U konkretnim primjerima je dovoljno kompletirati radnu tabelu računajući za svaki interval vrijednosti F j Q j +1 − F j +1Q j . Zbir svih tako izračunatih

(

)

vrijednosti predstavlja Ginijev koeficijent koncentracije. 93

Statistika u ekonomiji i menadžmentu

U tabeli 2.16. su dati podaci o izračunatim indeksima nejednakosti u raspodjeli potrošnje stanovništva Bosne i Hercegovine i entiteta. Tabela 2.16. Indeksi nejednakosti za BiH i entitete u 2001.g. Indeks nejednakosti Decilni omjeri potrošnje po stanovniku (omjer potrošnje od bogatih do siromašnih) 90/10 postotni omjer Od srednjih ka siromašnim (50/10) Bogati ka srednjim (90/50) Kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji Najsiromašnijih 20% stanovništva Donja sredina 20% Sredina 20% Gornja sredina 20% Najbogatijih 20% stanovništva Ostali indeksi nejednakosti Gini indeks Devijacija srednjeg loga (Theil) Indeks entropije Gini indeks: koristeći OECD skalu

BiH

RS

FBiH

3,29 1,82 1,81

3,49 2,00 1,74

3,13 1,74 1,80

9,5 14,2 17,9 22,7 35,8

9,2 14,3 18,3 23,1 35,1

9,9 14,2 17,7 22,5 35,8

0,26 0,11 0,12 0,24

0,26 0,11 0,11 0,24

0,26 0,11 0,12 0,23

Izvor: Bosnia and Herzegovina: Poverty Assessment, Volume II: Data on Poverty, Report No.25343-BiH, Document of the World Bank, 2003. g., str. 35.

U prvom dijelu tabele su prezentirani decilni omjeri kao relativni pokazatelji potrošnje po stanovniku. Relativni interdecilni omjer D9/D1 izmedu 10% najbogatije i 10% najsiromašnije proporcije stanovništva prema potrošnji pokazuje da je potrošnja osobe koja se nalazi na početku desetog dijela bila za 3,29 puta veća od potrošnje osobe koja se nalazi u gornjem dijelu prvih 10% stanovništva. Ili, globalno, potrošnja 10% najbogatijih je bila za 3,29 puta veća od potrošnje 10% najsiromašnijih. Predstavljeni su i interdecilni omjeri: D5/D1 označen kao omjer od srednje bogatih ka siromašnim, kao i odnos D9/D5 kao omjer bogatih prema srednje bogatim. Relativni odnosi D9/D1 i D5/D1 ukazuju na veću nejednakost u entitetu RS u odnosu na FBiH, dok je u slučaju interdecilnog omjera D9/D5 nejednakost više izražena u FBiH.

94

Poglavlje 2. – Analiza i sinteza podataka

U drugom dijelu tabele su prezentovani kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji proporcija od po 20% stanovništva rangiranih od najsiromašnijih do najbogatijih. U BiH udio 20% najsiromašnijih u ukupnoj potrošnji je 9,5% a 20% najbogatijih čak 35,8% što ukazuje na značajnu nejednakost u raspodjeli ukupne potrošnje. Proporcije po entitetima su približno istog reda vrijednosti. Vrijednost Ginijevog indeksa je 0,26 što ukazuje na značajan nivo koncentracije potrošnje, odnosno na nejednakost u raspodjeli ukupne potrošnje u BiH i entitetima. Ginijev indeks prilagođen OECD skali je još niži i iznosi 0,24. % 100 90 80 70

Lorenzova kriva za BiH potpuna jednakost

60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100

Grafikon 2.18.

%

Lorenzova kriva potrošnje per capita u BiH za 2001. godinu

2.7.3. Medijala Medijala je vrijednost varijable pridružena relativnoj kumulativnoj rastućoj globalnoj vrijednosti od 50%. Postupak za određivanje medijale je sljedeći: •

izračunati globalne vrijednosti f j ⋅ x j

95

Statistika u ekonomiji i menadžmentu



izračunati relativne globalne vrijednosti q j = f j ⋅ x j / ∑ f j ⋅ x j



izračunati relativne kumulativne rastuće frekvencije globalne vrijednosti Qj odrediti medijalnu klasu izračunati vrijednost medijale korištenjem sljedećeg izraza

• •

Mle =

( xi − xi −1 ) ⋅[0,50 − Q( xi −1 )] Q( xi ) − Q( xi −1 )

+ xi −1

(2.101)

Odstupanje između medijale i medijane je pokazatelj koncentracije:

δM = Ml − Me e

(2.102)

Veća vrijednost ovog pokazatelja predstavlja veću koncentraciju i veću nejednakost u raspodjeli.

2.8. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.

96

Definišite pojam statistike. Navedite etape statističkog istraživanja. Navedite sinonime za statistički skup i statističku varijablu. Definišite statističku varijablu. Definišite i analizirajte četiri osnovna tipa mjernih skala i njihove osobine. Definišite nominalnu mjernu skalu i njene karakteristike. Definišite statističku kvalitativnu varijablu i analizirajte njene tipove i karakteristike. Analizirajte vrste kvantitativnih statističkih varijabli i njihove osobine. Uporedite i komentirajte negrupisanu statističku seriju, uređenu statističku seriju i statističku distribuciju frekvencija. Koje vrste frekvencija poznajete? Definišite ih i napišite formule za njihovo izračunavanje. Definišite rastuću kumulativnu frekvenciju. Nabrojite parametre centralne tendencije. Definišite medijanu i analizirajte njene osobine. Definišite mod. Definišite aritmetičku sredinu i analizirajte njene osobine. Koja je proporcija elemenata date serije koji se nalaze između Q1 i medijane?

Poglavlje 2. – Analiza i sinteza podataka

16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36.

Koja je proporcija elemenata date serije koji se nalaze između Q1 i Q3? Koja je proporcija elemenata date serije koji se nalaze između D1 i D9? Koja je proporcija elemenata date serije koji se nalaze iznad C99? Definišite geometrijsku sredinu. Definišite harmonijsku sredinu. Nabrojite parametre disperzije. Definišite interkvartilno apsolutno odstupanje. Navedite karakteristike prosječnog apsolutnog odstupanja. Definišite i analizirajte detaljno osobine i ekonomsko značenje standardne devijacije i varijanse. Objasnite četiri etape u konstrukciji varijanse. Napišite formule za varijansu i standardnu devijaciju i objasnite njihove prednosti i nedostatke u odnosu na ostale parametre disperzije. U kojim jedinicama mjere je izražena standardna devijacija i da li je možemo koristiti za poređenje serija izraženih u različitim jedinicama mjere? Definišite koeficijent varijacije i njegove karakteristike. Navedite teoremu koja omogućuje istovremeno tumačenje aritmetičke sredine i standardne devijacije. Koje informacije pruža Box-plot? Koje tipove asimetrije poznajete i kako ih možete analizirati? Analizirajte mjere zaobljenosti. Definišite mjere koncentracije. Objasnite konstrukciju i značenje Lorenzove krive. Definišite Ginijev koeficijent. Ako su vrijednosti Ginijevog koeficijenta 0,2 i 0,8 objasnite njihovo značenje

97

Statistika u ekonomiji i menadžmentu

2.9. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA Zadatak 1. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.

Koje su vrste varijabli pomoću kojih možemo mjeriti: Godine jedne osobe: kvantitativna diskretna Cijenu hljeba: kvantitativna (diskretna ili kontinuirana) ili kvalitativna ordinalna Temperaturu u amfiteatru: kvantitativna (intervalna skala) Ljubaznost jedne osobe: kvalitativna ordinalna Boju očiju vaše djevojke: kvalitativna nominalna Jačinu tona: kvantitativna Inteligenciju jedne osobe: kvalitativna ordinalna ili kvantitativna ako je izražena preko koeficijenta inteligencije Stručnu spremu zaposlenih na zaposlenih na fakultetu: kvalitativna ordinalna Nivo razvijenosti jedne zemlje: kvalitativna ordinalna Težinu studenata: kvantitativna kontinuirana Visinu studentica: kvantitativna kontinuirana Razumijevanje ovog pitanja: kvalitativna ordinalna

Zadatak 2. Ispit iz predmeta Ekonometrija je bio sastavljen od 6 pitanja. Poslije ispravke 100 radova, nastavnik je evidentirao broj tačnih odgovora svakog studenta u sljedećoj tabeli: 3 5 2 1 4

6 1 3 3 3

5 1 4 2 1

2 2 1 5 4

3 5 1 2 6

3 4 4 4 1

3 6 2 6 2

4 0 3 3 3

5 4 1 1 1

4 1 5 2 6

2 4 2 4 1

3 6 3 5 4

2 2 1 2 5

2 4 3 4 2

2 5 3 6 2

4 1 5 1 6

5 3 2 2 1

5 3 2 3 3

6 3 2 1 3

2 1 1 1 2

1. Definišite populaciju, elemente populacije i posmatranu varijablu. Koji je tip posmatrane varijable? 2. Koja je veličina populacije? Koji su modaliteti posmatrane varijable? 3. Kompletirajte statističku distribuciju. 4. Predstavite grafički ovu distribuciju. 5. Komentarišite uspjeh studenata na ovom ispitu. Koji je prosječan broj tačnih odgovora? Odredite mod i medijanu. 98

Poglavlje 2. – Analiza i sinteza podataka

Elementi rješenja: 1. i 2. Populacija: radovi studenata, element populacije: rad studenta, varijabla: kvantitativna diskretna tačan broj odgovora ima 7 modaliteta, veličina populacije 100 radova studenata. 3. Modaliteti xj

Apsolutna frekvencija fj 1 20 23 20 15 12 9 100

0 1 2 3 4 5 6 -

Relativna frekvencija pj 0,01 0,20 0,23 0,20 0,15 0,12 0,09 1,00

Relativna rastuća kumulativna frekvencija Fj 0,01 0,21 0,44 0,64 0,79 0,91 1,00 -

4. 25

Broj studenata

20 15 10 5 0

0

Grafikon 2.19.

1

2 3 4 Broj tacnih odgovora

5

6

Ispitni rezultati

5. Prosječan broj tačnih odgovora je 3. Mod je jednak 2. Medijana je jednaka 3. 99

Statistika u ekonomiji i menadžmentu

Zadatak 3. Među osobama koje su se vjenčale u junu 2002 godine, 10 osoba je jedinac/jedinica, 16 osoba ima jednog brata ili sestru, 7 osoba ima 2 brata ili sestre, 3 osobe imaju 3 brata ili sestre, 3 osobe 4 brata ili sestre, nijedna osoba nema 5 braće ili sestara i jedna osoba ima 6 braće ili sestara. 1. Odredite posmatranu populaciju i njenu veličinu. 2. Koja je posmatrana varijabla, njen tip i modaliteti ? 3. Kompletirajte statističku distribuciju i grafički je predstavite. 4. Izračunajte mod, medijan i aritmetičku sredinu. Elementi rješenja: 3. Varijabla

Broj braće i sestara (xj) 0 1 2 3 4 5 6 Ukupno

100

Kumulativna Apsolutna apsolutna frekvencija frekvencija

Relativna frekvencija

Relativna rastuća kumulativna frekvencija

fj

Sj

pj

Fj

10 16 7 3 3 0 1 40

10 26 33 36 39 39 40

0,25 0,4 0,175 0,075 0,075 0 0,025 1

0,25 0,65 0,825 0,9 0,975 0,975 1

Poglavlje 2. – Analiza i sinteza podataka

Apsolutna frekvencija

20 16 15 10

10 7

5 0

3

3 0

0

1

2

3

4

5

1 6

Broj brace i sestara Grafikon 2.20.

Dijagram sa stupcima za varijablu broj brace i sestara

4. Parametri centralne tendencije • Mod: 1 brat ili sestra • Medijana: 1 brat ili sestra • Aritmetička sredina: 1,425

Zadatak 4. Za svaku od sljedećih distribucija kompletirajte intervale i izračunajte centre svakog intervala. Prečnik u mm:

Godine starosti:

Težina u kg:

140-145 145-150

0- 5 godina 6-10 godina

manje od 70 70 i manje od 75

150-155 155-160

11-15 godina 16-20 godina

75 i manje od 80 80 i manje od 85

160-165 165-170

21-25 godina 26-30 godina

85 i manje od 90 90 i manje od 100 više od 100

Komentirajte kompletirane distribucije. 101

Statistika u ekonomiji i menadžmentu

Elementi rješenja: Prečnik u mm: xj

[140-145[ [145-150[ [150-155[ [155-160[ [160-165[ [165-170]

Centar xc 142,5 147,5 152,5 157,5 162,5 167,5

Godine starosti: xj

Centar xc 2,75 8 13 18 23 28

[0-5,5[ [5,5-10,5[ [10,5-15,5[ [15,5-20,5[ [20,5-25,5[ [25,5-30,5]

Težina u kg: xj

[0-70[ [70-75[ [75-80[ [80-85[ [85-90[ [90-100[ [100;+∞]

Centar xc 35 72,5 77,5 82,5 87,5 95 -

U trećoj distribuciji zadnji interval nema centra i zbog toga trebate biti vrlo oprezni u tumačenju rezultata. Zadatak 5. Kompletirajte sljedeću tabelu: Klase xj

Centri xc

[10;20[ [20;30[ [30;40[ [40;60[ [60;80]

Rastuća kumulativna relativna frekvencija Fj

pj

Korigovana relativna frekvencija pj/aj

0,08 0,21 0,55 0,86

Elementi rješenja: Klase

Amplituda aj

Centri xc

pj

Fj

[10;20[ [20;30[ [30;40[ [40;60[ [60;80]

10 10 10 20 20

15 25 35 50 70

0,08 0,21 0,26 0,31 0,14

0,08 0,29 0,55 0,86 1,00

102

Korigovana relativna frekvencija pj/aj 0,008 0,021 0,026 0,015 0,007

Poglavlje 2. – Analiza i sinteza podataka

Zadatak 6. Na osnovu statističkog istraživanja jedne populacije izvršeno je grupisanje elemenata populacije u intervale čiji su centri sljedeći: 52, 60, 68, 76, 84, 92. 1. Koja je amplituda posmatranih intervala? 2. Izračunajte gornju i donju granicu svakog intervala i kompletirajte tako grupisanu distribuciju. Elementi rješenja: 1. Amplituda svake klase je 8. 2. [48;56[, ..........., [88;96[ Zadatak 7. 50 studenata je odgovaralo na test koji se sastojao od 20 pitanja. Sljedeća serija je kompletirana na osnovu broja tačnih odgovora: 10 11 7 11 11

8 11 11 7 19

3 8 10 8 9

12 5 10 10 4

13 13 2 13 10

9 14 15 9 8

12 14 12 13 9

9 6 10 9 6

12 12 1 7 7

11 16 14 13 14

1. Predstavite rezultate u obliku distribucije frekvencija grupisane u intervale tako da prvi i posljednji interval imaju amplitudu 5 a ostale klase amplitudu 2. 2. Izračunajte relativne frekvencije. 3. Izračunajte kumulativne relativne frekvencije. 4. Koja je proporcija studenata čiji je broj tačnih odgovora bio manji od 9? 5. Koja je proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13? 6. Koja je proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20? 7. U kojem intervalu je gustoća najmanja, a u kojoj najveća? 8. Konstruišite odgovarajuću grafičku prezentaciju analizirane distribucije.

103

Statistika u ekonomiji i menadžmentu

Elementi rješenja: U tabeli odgovori 1.,2.,3. Intervali xj

fj

pj

Fj

[0;5[ [5;7[ [7;9[ [9;11[ [11;13[ [13;15[ [15;20] Ukupno

4 3 8 12 11 9 3 50

0,08 0,06 0,16 0,24 0,22 0,18 0,06 1,00

0,08 0,14 0,30 0,54 0,76 0,94 1,00 -

Korigovana frekvencija (gustoća) pj / aj 0,8 1,5 4,0 6,0 5,5 4,5 0,6 -

4. Proporcija studenata čiji je broj tačnih odgovora bio manji od 9 je 30%. 5. Proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13 je 24%. 6. Proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20 je 92%. 7. Najmanja gustoća 0,6 je u intervalu [15;20[, a najveća u intervalu [9;11[ i iznosi 6,0. 8. Grafička prezentacija analizirane distribucije je histogram koji je potrebno konstruisati na osnovu podataka kolone korigovana frekvencija. Zadatak 8. U sljedećoj statističkoj seriji je predstavljen broj sati koje je 13 studenata posvetilo pripremi testa iz Statistike: 5

6

2

7

11

9

3

4

9

8

7

3

7

1. Odredite aritmetičku sredinu. 2. Odredite medijanu i njenu kumulativnu frekvenciju. Komentarišite dobijeni rezultat. 3. Odredite mod. 104

Poglavlje 2. – Analiza i sinteza podataka

Elementi rješenja: 1. Aritmetička sredina jednaka je 6,23. 2. Uređena serija po rastućem redu podataka: 2 3 3 4 5 6 7 7 7 8 9 9 11 Broj podataka je neparan i medijana je jednaka:

Me = x

(

n +1 ) 2

= x 13+1 = x ( 7 ) = 7 (

2

)

Kumulativna frekvencija je jednaka: F j =

xj fj Sj

2 1 1

3 2 3

4 1 4

5 1 5

6 1 6

7 3 9

Sj N

=

8 1 10

9 = 0,6923 ⇒ 69,23% 13 9 2 12

11 1 13

Ukupno 13

3. Mod je jednak 7. Zadatak 9. Dati su sljedeći podaci o distribuciji zaposlenih prema godišnjoj plati u eurima: Prosječna plata 12 090 eura Medijanska plata 11 175 eura Standardna devijacija 4 600 eura Ginijev koeficijent 0,20 Plate variraju u intervalu od 8 400 do 30 500 eura. Kako će se mijenjati navedeni parametri uz sljedeće pretpostavke: 1. Sve plate su povećane za 200 eura. 2. Za 150 eura su povećane samo plate manje od 9 050 eura. 3. Za 10% su smanjene plate veće od 22 870 eura. 4. Sve plate su povećane za 10%. 5. Za svaki odgovor dajte neophodna objašnjenja. Elementi rješenja: 1. Ako su sve plate povećane za 200 eura, ukupni platni fond (masa plata) se povećava. Prosječna plata i medijana se povećaju za 200 eura. 105

Statistika u ekonomiji i menadžmentu

Standardna devijacija ostaje nepromijenjena. Ginijev koeficijent se smanjuje. Plate variraju u intervalu (8600; 30700) eura. 2. Ako se za 150 eura povećaju samo plate manje od 9 050, eura ukupna masa plata i prosječna plata se povećavaju. Pošto nijedna povećana plata nije veća od medijane, medijana ostaje nepromijenjena. Disperzija se smanjuje jer se povećane plate približavaju prosječnoj plati. Ginijev indeks se smanjuje. Plate variraju u intervalu (8 550; 30 500) eura. 3. Ako su za 10% smanjene plate veće od 22 870, eura masa plata i prosječna plata se smanjuju. Medijana se ne mijenja jer je 22 870 veće od 11 175 eura. Disperzija se smanjuje jer se smanjene plate približavaju prosječnoj plati. Standardna devijacija se smanjuje. Nejednakost u raspodijeli mase plata se smanjuje i Ginijev koeficijent također se smanjuje. Plate variraju u intervalu (8 400; 27 450) eura. 4. Ako se sve plate povećaju za 10%, prosječna plata, medijana, i standardna devijacija se povećavaju za 10%. Ginijev koeficijent se ne mijenja. Raspon plata se povećava i plate variraju u intervalu (9 240; 33 550) eura. Zadatak 10. Poznata je sljedeća distribucija godišnjih plata u jednom preduzeću: Godišnje plate xi u KM

[5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno

Broj zaposlenih (fj) 60 80 105 110 35 10 400

Frekvencija (pj) u% 15,00 20,00 26,25 27,50 8,75 2,50 100,00

1. Nacrtajte kumulativnu krivu. 2. Pomoću kumulativne krive procijenite grafički, a zatim odredite analitički vrijednosti kvartila. 3. Nacrtajte box- plot i komentarišite karakteristike distribucije. 4. Odredite prosječnu platu, standardnu devijaciju i koeficijent varijacije. Objasnite dobijene rezultate. 5. Kompletirajte sljedeću tabelu: 106

Poglavlje 2. – Analiza i sinteza podataka Godišnje plate xi u KM

Broj zaposlenih

Frekvencija

(fj)

u%

(pj)

Kumulativna frekvencija

(Fj)

Centar intervala

Masa plata (agregat)

xcj

fj .xcj

qj u%

u% [5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno

60 80 105 110 35 10 400

15,00 20,00 26,25 27,50 8,75 2,50 100,00

15 35 61,25 88,75 97,5 100 -

Relativni Agregat

6 000 7 000 8 500 10 000 13 000 17 500

360 000 600 000 892 500 1 100 000 455 000 175 000 3 582 500

10,0 16,7 24,9 30,7 12,7 4,9 100,0

Relativni kumulativni agregat

Qj u% 10,0 26,8 51,7 82,4 95,1 100,0

6. Konstruišite Lorenzovu krivu. 7. Izračunajte Ginijev koeficijent. 8. Koji bi bio oblik Lorenzove krive ako bi svih 400 zaposlenih imali jednaku platu? 9. Koji bi bio oblik Lorenzove krive ako 399 zaposlenih ne bi primali platu, a 1 zaposleni (šef) primio 3 582 500 KM? 10. Koji je vaš zaključak o disperziji i koncentraciji analizirane distribucije plata? Elementi rješenja: 2. F(Q1)=0,25 interval kojem pripada prvi kvartil je 7000-8000 i primjenom formule na bazi kumulativnih frekvencija dobijamo: Q1=7500; Q2=Me=8571,42≈8571; Q3=10 000 4. Prosječna plata (aritmetička sredina) je jednaka približno 8956 KM; standardna devijacija 2312 KM i koeficijent varijacije 0,26%. 5. Tabela kompletirana na početku. 7. Ginijev koeficijent G = 1 − ∑ f j (Q j −1 + Q j ) G = 1−

1 104

∑f

j

(Q j −1 + Q j )

107

Statistika u ekonomiji i menadžmentu

⎡15(0 + 10, 05) + 20(10, 05 + 26,8) + 26, 25(26,8 + 51, 71) + ⎤ ⎢ +27,5(51, 71 + 82, 41) + 8, 75(82, 41 + 95,11) + 2,5(95,11 + 100) ⎥ ⎣ ⎦

G = 1−

1 104

G = 1−

1 ⋅ 8678 = 0,132 104

8. Lorenzova kriva bi se podudarala sa dijagonalom (linijom jednake raspodjele) i koncentracija bi bila jednaka nuli, dakle raspodjela bi bila savršeno ravnomjerna. 9. Lorenzova kriva bi se podudarala sa katetama trougla ispod dijagonale, koncentracija bi bila jednaka jedinici i postojala bi savršena nejednakost u raspodjeli. 10. Distribucija mase plata (globalne vrijednosti) je relativno ravnomjerno raspodijeljena. Disperzija plata nije previše izražena. Plate su uglavnom koncentrisane u sredini serije. Zadatak 11. U sljedećoj tabeli su predstavljeni podaci koji se odnose na koncentraciju prihoda domaćinstava u regionu X u 2005. godini. Broj grupe Grupa 1 Grupa 2 Grupa 3

Fj u % 25 50 75

Prihod u KM 45 046 267 274 628 832

Qj u % 0,82 6,04 25,64

1. Koji je statistički termin za podatke predstavljene u trećoj koloni? 2. Konstruišite kumulativnu krivu uz pretpostavku da je maksimalan prihod domaćinstva 1 milion KM. Nacrtajte box-plot i komentirajte dobijene rezultate. 3. Nacrtajte Lorenzovu krivu. Komentarišite. 4. Izračunajte Ginijev koeficijent i objasnite ga. Uporedite vaš odgovor sa komentarom datim pod tačkom 3.

108

Poglavlje 2. – Analiza i sinteza podataka

Elementi rješenja: 4.

1 ∑ f j (Q j −1 + Q j ) = 1 − 104 − [ 25(0 + 0,82) + 25(0,82 + 6, 04) + 25(6, 04 + 25, 64) + 25(25, 64 + 100) ]

G = 1−

= 1−

1 ⋅ 4276 = 1 − 0, 4276 = 0,5724 104

Postoji jaka koncentracija mase prihoda domaćinstava u regionu X u 2005.g. Zadatak 12. Data je sljedeća distribucija plata: Iznos u novčanim jedinicama xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno

Frekvencija fj 410 637 785 724 2556

1. Kompletirati sljedeći tabelu: xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno

2. 3. 4. 5. 6.

fj 410 637 785 724 2556

pj u %

Fj u %

16,04 24,92 30,71 28,33 100

16,04 40,96 71,67 100

xc

xc ⋅ fj

qj u % Qj u %

7 500 3 075 000 3,69 15 000 9 555 000 11,48 30 000 23 550 000 28,29 65 000 47 060 000 56,54 83 240 000 100,00

3,69 15,17 43,46 100,00

Odredite medijanu polazeći od kumulativnih frekvencija Izračunajte Ginijev koeficijent i komentarišite dobijeni rezultat. Konstruišite Lorenzovu krivu i dajte vaš komentar. Izračunajte medijalu. Izračunajte odstupanje medijala-medijana. 109

Statistika u ekonomiji i menadžmentu

Elementi rješenja: 1. 2. 3. 4.

Tabela kompletirana. Me=25 885,35 G=0,3606 Lorenzova kriva pokazuje veliku nejednakost u raspodjeli ukupne mase plata. 5. Medijala: 45 783,52 6. Odstupanje medijala-medijana: 45 783,52-25 885,35=19 898,17

110

POGLAVLJE 3.

REGRESIONA I KORELACIONA ANALIZA

U dosadašnjim poglavljima smo analizirali i istraživali populaciju u odnosu na samo jednu varijablu. Međutim, vrlo često se dešava da se statistička istraživanja jedne populacije baziraju simultano na dvije ili više kvantitativnih varijabli. Pitanje koje se postavlja u ovom slučaju je traženje i određivanje eventualne veze između ovih varijabli. U prvom dijelu ovog poglavlja ćemo analizirati modelizaciju veza između dvije ili više varijabli, a zatim metode kvantifikacije veza i njihovu primjenu. Drugi dio poglavlja obrađuje mjere reprezentativnosti i kvaliteta ocijenjenih modela.

3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI Da bismo pristupili modelizaciji veza između dvije ili više varijabli polazimo od sljedećih pretpostavki: 1. Modeliziranje možemo vršiti ukoliko postoji zavisnost između varijabli. 2. Mogu se modelizirati jedino kvantitativne varijable, jer je u tom slučaju moguće kompletirati oblak (dijagram) rasipanja, računati mjere centralne tendencije i disperzije. 111

Statistika u ekonomiji i menadžmentu

3.1.1. Etape konstrukcije modela Model je pojednostavljena slika realnosti i služi da bismo na pogodan način kvantificirali složene ekonomske fenomene. Etape konstrukcije i ocjene jednog modela su sljedeće: • Odabrati nezavisnu i zavisnu varijablu • Grafički predstaviti na dijagramu rasipanja posmatrane podatke da bi se potvrdila ili odbacila pretpostavka o zavisnosti 2 statističke varijable. • Na osnovu dijagrama procijeniti oblik veze između posmatranih varijabli i konstruisati odgovarajući model. Postoje različiti oblici veza kao npr. linearna, krivolinijska, eksponencijalna itd. • Ocijeniti primjenom odgovarajućih metoda odabrani model. • Izračunati rezidualna (neobjašnjena) odstupanja ocijenjenih od posmatranih podataka i analizirati ih. • Procijeniti kvalitet ocijenjenog modela. 3.1.1.1. Dijagram (oblak) rasipanja Postoje različiti oblici zavisnosti varijabli. Neke od njih smo predstavili na sljedećem grafikonu. Y

Y

a

112

X

Y

d Grafikon 3.1.

b

X

Y

Y

X

c

X

f

X

Y

e

X

Razliciti oblici veza izmedu dvije varijable – dijagram rasipanja

Poglavlje 3. – Regresiona i korelaciona analiza

U slučajevima a i b veze su linearne. U slučaju a, sa rastom nezavisne dolazi do rasta zavisne varijable. U slučaju b, rast nezavisne varijable uzrokuje opadanje zavisne varijable. U slučaju c ne bismo mogli utvrditi postojanje veze jer povećanje nezavisne varijable ne mijenja zavisnu varijablu. U slučajevima d, e i f postoje krivolinijske veze između nezavisne i zavisne varijable. Smjer njihovih promjena je isti u slučaju d, a suprotan u slučaju f. Dijagram rasipanja pruža polaznu informaciji o obliku zavisnosti između dvije varijable.

3.2. KOVARIJANSA Kovarijansa mjeri uzajamnu varijabilnost dvije varijable u odnosu na njihove respektivne aritmetičke sredine: Cov( X , Y ) =

1 n ∑ ( xi − x ) ⋅ ( yi − y ) . n i =1

(3.1)

Kovarijansa nam omogućava da utvrdimo da li postoji simultana varijacija između vrijednosti varijabli X i Y u odnosu na odabranu tačku čije su koordinate aritmetičke sredine varijabli X i Y.b Razvijena formula kovarijanse omogućava jednostavnije izražavanje varijanse: Cov( X , Y ) =

1 ∑ ( xi − x ) ⋅ ( yi − y ) n i

=

1 ∑ ( xi yi − xi y − xyi + x ⋅ y ) n i

=

1 1 1 xi yi − y ∑ xi − x ∑ yi + x ⋅ y ∑ n i n i n i

=

1 ∑ xi yi − y ⋅ x − x ⋅ y + x ⋅ y n i

Cov( X , Y ) =

1 n ∑ xi yi − x ⋅ y n i =1

(3.2)

Cov( X , Y ) = xy − x ⋅ y

113

Statistika u ekonomiji i menadžmentu

Na osnovu gornje relacije možemo zaključiti da je kovarijansa jednaka razlici između aritmetičke sredine proizvoda i proizvoda aritmetičkih sredina varijabli X i Y. Kovarijansa varijable X sa varijablom X (sa samom sobom) predstavlja generaliziranu formulu varijanse:lnih zavisnosti

Cov( X , X ) =

1 n 1 n 2 x − x x − x = ( )( ) ( xi − x ) = σ X2 ∑ ∑ i i n i =1 n i =1

(3.3)

Kovarijansa je pozitivna ako oblak rasipanja ima generalno rastuću tendenciju. Kovarijansa je negativna kada oblak rasipanja ima generalno opadajuću tendenciju. Kovarijansa je jednaka ili približno jednaka nuli ako oblak rasipanja nije ni rastući ni opadajući ili ukoliko je pola opadajući, a pola rastući. Kada X i Y variraju u istom smjeru, kovarijansa je pozitivna. Kada X i Y variraju u suprotnom smjeru, kovarijansa je negativna. Ako nema ni rastuće ni opadajuće generalne tendencije, kovarijansa je jednaka nuli. Na sljedećem primjeru ćemo ilustrovati kompletiranje oblaka rasipanja i izračunavanje kovarijanse. Primjer 3.1. Tabela 3.1. Prihod preduzeća izražen u hiljadama KM (Y) i proizvodnja izražena u kilogramima (X)k

xi

zyi

50 100 150 200 250 300 350

20 25 25 35 30 35 40

U ovom slučaju prihod preduzeća Y je zavisna varijabla, a proizvodnja izražena u kilogramima nezavisna varijabla. Mi ćemo posmatrati prihod u funkciji ostvarene proizvodnje i konstruisati dijagram rasipanja.

114

Poglavlje 3. – Regresiona i korelaciona analiza

Prihod u 000 KM

50 40 30 20 10 0

0

50

100

Grafikon 3.2.

150 200 250 Proizvodnja u kg

300

350

400

Dijagram rasipanja

Na osnovu dijagrama rasipanja konstatujemo da postoji linearna veza između dvije posmatrane varijable. Da bismo potvrdili ovu konstataciju, izračunat ćemo vrijednost kovarijanse. Tabela 3.2. Radna tabela za računanje kovarijanse

Σ

xi

yi

( xi − x )

( yi − y )

( xi − x )( yi − y )

( xi − x ) 2

50 100 150 200 250 300 350 1400

20 25 25 35 30 35 40 210

-150 -100 -50 0 50 100 150 0

-10 -5 -5 5 0 5 10 0

1500 500 250 0 0 500 1500 4250

22500 10000 2500 0 2500 10000 22500 70000

Aritmetička sredina varijabli X i Y je x = 200 ; y = 30 . Na osnovu podataka iz tabele izračunali smo kovarijansu: Cov( X , Y ) =

1 n

n

1

∑ ( x − x ) ( y − y ) = 7 ⋅ 4250 = 607,14 i

i

i =1

115

Statistika u ekonomiji i menadžmentu

Visoka vrijednost kovarijanse potvrđuje već konstatovanu činjenicu uzajamne varijabilnosti varijabli X i Y. •

Zbir i razlika statističkih varijabli

Koristeći kovarijansu možemo analizirati varijansu zbira i razlike statističkih varijabli i izraziti ih na sljedeći način:. Var(X+Y)=VarX + Var Y+ 2 Cov(X,Y)

(3.4)

Var(X-Y)=VarX + Var Y- 2 Cov(X,Y)

(3.5)

Ako su X i Y nezavisne, kovarijansa je jednala nuli (Cov(X, Y)=0). U tom slučaju zbir i razlika statističkih varijabli se mogu izraziti sljedećim relacijama: Var(X+Y)=VarX + Var Y

(3.6)

Var(X-Y)=VarX + Var Y

(3.7)

3.3. REGRESIONA ANALIZA Kada se pomoću statističkih metoda istražuje jedna pojava nezavisno od ostalih, radi se o jednodimenzionalnoj statističkoj analizi. Statističkim metodama možemo analizirati i međusobne odnose više pojava. U tom slučaju se radi o višedimenzionalnoj analizi. Ovim metodama ne analiziramo uzroke ni posljedice pojava, već zavisnost pojava i njihovih promjena. Veze među pojavama, kao što smo već istakli, mogu biti funkcionalne i stohastičke. Statistička analiza odnosa između dvije ili više pojava se vrši metodama deskriptivne i inferencijalne statistike. Stepen statističke povezanosti između pojava se istražuje metodama korelacione analize. Za određivanje analitičkog odnosa među pojavama primjenjuju se regresioni modeli. Veza među pojavama je funkcionalna ako su vrijednostima jedne pojave u potpunosti određene vrijednosti druge pojave. U tom slučaju za svaku vrijednost nezavisne varijable možemo precizno odrediti vrijednosti zavisne varijable. Funkcionalne veze najčešće susrećemo u prirodnim naukama i u manjoj mjeri u društvenim naukama. Kada jednoj vrijednosti nezavisno promjenljive X odgovara više vrijednosti zavisno promjenljive Y kažemo da je njihova veza stohastička. Npr. veza između potrošnje i dohotka domaćinstava. Opšti oblik regresionog modela je sljedeći: 116

Poglavlje 3. – Regresiona i korelaciona analiza

Y = f ( X 1 , X 2 ,...., X K ) + e

(3.8)

gdje je Y zavisna promjenljiva, X su nezavisne promjenljive i parametar e slučajno odstupanje. Model (3.8.) se naziva model višestruke regresije ili višedimenzionalni regresioni model. Model koji sadrži zavisnu i jednu nezavisnu promjenljivu naziva se model jednostavne regresije ili jednodimenzionalni regresioni model. Model jednostavne regresije ima sljedeći oblik:

Y = f (X ) + e

(3.9)

Zadatak regresione analize je istraživanje analitičkog oblika veze između pojava kojem se najviše približavaju promjene analiziranih pojava. Zadatak korelacione analize je utvrđivanje stepena i smjera povezanosti pojava. 3.3.1. Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavimo da je veza zavisne varijable Y i nezavisne varijable X linearna. Y je varijabla koju treba objasniti pomoću varijable X. Polazni model linearne regresije za skup od n vrijednosti (xi, yi) varijabli X i Y se može napisati u sljedećem obliku:

y i = a + bxi + ei , i = 1,2,..., n.

(3.10)

Označimo sa

yˆ i = a + bxi

(3.11)

funkcionalni dio modela gdje su a i b parametri koje treba ocijeniti. Podaci su dati kao n posmatranih parova (xi, yi), a yˆi predstavlja ocijenjene vrijednosti Y na osnovu posmatranih vrijednosti xi od X. Na osnovu izraza (3.9.) i (3.10) možemo napisati relaciju

yi = yˆ i + ei

(3.12)

iz koje možemo izraziti slučajno ili rezidualno odstupanje ei kao razliku između posmatranih i ocijenjenih vrijednosti varijable Y:

e i = yi − yˆ i e i = yi − a − bxi

(3.13)

117

Statistika u ekonomiji i menadžmentu

Slučajno odstupanje smo predstavili na sljedećem grafikonu. y

yˆ i = a + bxi

yi ei = yi − yˆ i

yˆ i

xi Grafikon 3.3.

x

Rezidualna odstupanja

Cilj je primijeniti metod za ocjenu parametara regresionog modela koji će minimizirati rezidualna odstupanja. Pitanje koje se postavlja je izbor kriterija koji će obezbijediti minimizaciju slučajnih odstupanja. Jedan od kriterija bi mogao biti zbir rezidualnih odstupanja jednak nuli:

∑ ei = ∑ ( yi − yˆi ) = 0 i

i

Sve prave koje prolaze kroz tačku gravitacije G ( x , y ) zadovoljavaju ovaj kriterij jer se pozitivna i negativna rezidualna odstupanja anuliraju. Zbog toga ovaj kriterij ne može poslužiti za izbor najbolje regresione prave. Kriterij koji nam omogućava izbor najbolje regresione prave je minimiziranje zbira kvadrata rezidualnih odstupanja:

minimum

∑ ei2

(3.14)

i

Na ovom kriteriju je baziran metod najmanjih kvadrata. Minimiziranje zbira kvadrata rezidualnih odstupanja: n

n

n

i =1

i =1

i =1

∑ ei2 = ∑ ( y i −yˆ i ) 2 = ∑ ( y i −a − bxi ) 2 118

(3.15)

Poglavlje 3. – Regresiona i korelaciona analiza

je moguće uz potrebne uslove koji zahtijevaju da parcijalni izvodi ovog zbira po parametrima a i b budu jednaki nuli: n

∂ ∑ ei2 i =1

∂a

n

= 2∑ ( y i −a − bx i )(−1) = 0

(3.16)

i =1

n

∂ ∑ ei2 i =1

∂b

n

= 2∑ ( y i −a − bx i )(− x i ) = 0

(3.17)

i =1

Iz ovih uslova slijedi sistem normalnih jednačina n

n

i =1

i =1

∑ y i = na + b∑ xi

(3.18)

n

n

n

i =1

i =1

i =1

∑ xi yi = a∑ xi + b∑ xi2

(3.19)

Rješavanjem ovog sistema normalnih jednačina dobijamo izraze za ocjenu parametara a i b: n

a=

∑y i =1

n

i

−b

n

∑x i =1

i

(3.20)

n

a = y − bx

(3.21)

Zamjenom ovog izraza u drugu normalnu jednačinu 3.19. dobijamo izraz za izračunavanje parametra b:

∑ x y = ( y − bx )∑ x + b∑ x ∑ x y = y ∑ x − bx ∑ x + b∑ x ∑ x y − y ∑ x = b(∑ x − x ∑ x ) ∑ x y − y∑ x b= ∑ x − x∑ x 2 i

i

i

i

i

i

i

i

2 i

i

i

i

2 i

i

i

i

2 i

i

(3.22)

i

119

Statistika u ekonomiji i menadžmentu

Parametar b možemo izraziti i u sljedećem obliku: n

b=

∑ x y − n⋅ x ⋅ y i

i =1

i

n

∑x i =1

2 i

− nx

(3.23)

2

odnosno

1 n ∑ xi yi − x ⋅ y n i =1 b= 1 n 2 xi − x 2 ∑ n i =1

(3.24)

Izraz u brojniku predstavlja razvijenu formulu kovarijanse Cov(X,Y), a izraz u nazivniku razvijenu formulu varijanse varijable X. Dakle, izraz za izračunavanje parametra b možemo napisati u sljedećem obliku:

b=

Cov( X , Y )

(3.25)

σ X2

3.3.2. Pretpostavke o osobinama stohastičnosti modela Regresioni model izražen regresionom pravom:

yi = a + bxi + ei , i = 1, 2,..., n.

(3.26)

je sastavljen iz dva dijela. Prvi dio modela (a+bxi) predstavlja funkcionalnu vezu pri kojoj je Y linearno zavisna od X ako su drugi faktori konstantni. Drugi, stohastički dio modela (ei), predstavlja slučajne varijacije, kojima se uzima u obzir djelovanje promjena drugih varijabli koje nisu eksplicitno uključene u model. Pod uslovom da specifikacija modela odgovara ekonomskoj relaciji u stvarnosti, i da bismo probleme mjerenja ekonomskih relacija preveli u probleme statističkog ocjenjivanja parametara rasporeda vjerovatnoće, neophodno je navesti pretpostavke o osobinama stohastičnosti linearnog regresionog modela:

120

a. E(ei) = 0,

(očekivana vrijednost greške je jednaka nuli)

b. E(ei2 ) = σ 2 ,

(konstantna zajednička varijansa)

Poglavlje 3. – Regresiona i korelaciona analiza

c. E(ei ej)= 0, 2

za svako i, j; i≠j; (nezavisnost)

d. ei: N(0, σ ),

(normalnost)

e. E(eiXj) = 0,

za sve i, j; (nezavisnost od Xj).

3.3.3. Aplikacija analiziranih metoda Na osnovu radne tabele 3.2. kompletirane na osnovu tabele 3.1. primjera 3.1. izračunavamo vrijednost parametara a i b i kompletiramo regresionu jednačinu: n 1 n x − x y − y ( ) ( ) ( xi − x ) ( yi − y ) i ∑ i ∑ Cov( X , Y ) n i =1 i =1 b= = = n Var ( X ) 1 n 2 x − x ( ) ( xi − x )2 i ∑ ∑ n i =1 i =1 b=

4250 = 0,061 70000

a = y − b ⋅ x = 30 − 0,061 ⋅ 200 = 17,857

yˆ = 17,857 + 0,061 ⋅ xi

Za ocjenu parametara regresione prave možemo koristiti statističke funkcije Excel-a. Rezultate dobijene primjenom ovog programa prezentujemo sljedećim tabelama i grafikonom. Tabela 3.3. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.1.

a. REGRESSION STATISTICS Multiple R 0,927426 R Square 0,860119 Adjusted R Square 0,832143 Standard Error 2,897043 Observations 7

121

Statistika u ekonomiji i menadžmentu

b. ANOVA SS MS 258,0357 258,0357 41,96429 8,392857 300

Regression Residual Total

df 1 5 6

Intercept X Variable 1

COEFFICIENTS 17,85714 0,060714

F 30,74468

Significance F 0,00262

STANDARD ERROR 2,448448 0,01095

T STAT 7,29325 5,544789

yˆ = 17,857 + 0,061x c. OBSERVATION 1 2 3 4 5 6 7

PREDICTED Y 20,89286 23,92857 26,96429 30 33,03571 36,07143 39,10714

RESIDUALS -0,89286 1,071429 -1,96429 5 -3,03571 -1,07143 0,892857

50

Prihod u 000 KM

40 30

yˆ = 0, 0607 x + 17, 857

20

R 2 = 0, 8601

10 0

0

Grafikon 3.4.

122

100

200 Proizvodnja u kg

300

Dijagram rasipanja i regresiona prava

400

Poglavlje 3. – Regresiona i korelaciona analiza

Koristeći navedeni program dobili smo ocjene vrijednosti parametara, jednačinu regresione prave, grafički prikaz i statističke parametre koji nam omogućuju analizu kvaliteta dobijene ocjene. Vrijednost parametra a je predstavljena kao odsječak na ordinatnoj osi. Vrijednost parametra b pokazuje za koliko jedinica se poveća prihod Y ako se proizvodnja X poveća za jedan kilogram. Primjenu navedenog programa ćemo ilustrovati i na sljedećem primjeru u kojem ćemo ocijeniti vezu između društvenog bruto proizvoda i prosječnog broja stanovnika. Posmatramo društveni bruto proizvod kao zavisnu i broj stanovnika kao nezavisnu ili eksplikativnu promjenljivu.

Primjer 3.2. Tabela 3.4. Društveni bruto proizvod (DBP) u milionima KM i prosječan broj stanovnika u 000 Godina

DBP u milionima KM

1996 1997 1998 1999 2000 2001

3049 6367 7244 8604 9611 10480

Prosječan broj stanovnika u hiljadama 3645 3756 3654 3752 3781 3798

DBP u milionima KM

12000 10000 8000 6000 4000 2000 0 3600

Grafikon 3.5.

3650

3700 3750 3800 prosječan broj stanovnika u 000

3850

Oblak rasipanja

123

Statistika u ekonomiji i menadžmentu

Dijagram rasipanja nam ukazuje na linearnu vezu između ove dvije promjenljive. Primjenom metode najmanjih kvadrata određujemo jednačinu regresione prave koja se najbolje prilagođava datim podacima. Ocijenjena regresiona prava zadovoljava uslov minimizacije kvadrata odstupanja ocijenjenih od posmatranih vrijednosti promjenljive Y. Tabela 3.5. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.2.

a. Intercept X Variable 1

COEFFICIENTS -115045 32,86094

STANDARD ERROR 45307,76 12,14204

yˆ = −115045 + 32,86 x b. REGRESSION STATISTICS Multiple R 0,804228 R Square 0,646783 Adjusted R Square 0,558479 Standard Error 1775,397 Observations 6

c. OBSERVATION 1 2 3 4 5 6

124

PREDICTED Y 4733,125 8380,69 5028,874 8249,247 9202,214 9760,85

RESIDUALS -1684,13 -2013,69 2215,126 354,7535 408,7861 719,15

Poglavlje 3. – Regresiona i korelaciona analiza

DBP u milionima KM

12000

yˆ = 32, 861 x − 115045

10000

R 2 = 0, 6468

8000 6000 4000 2000 0 3600

3650

3700

3750

3800

3850

Prosjecan broj stanovnika u 000 Grafikon 3.6.

Oblak rasipanja i linearna regresija

Reziduali 3000 2000 1000 0

3600

3650

3700

3750

3800

-1000 -2000 -3000

Grafikon 3.7.

varijabla

x

Dijagram rezidualnih odstupanja

Dobijene su pouzdane ocjene parametara. Na osnovu parametra b ocijenjene regresione jednačine konstatujemo da ako se broj stanovnika poveća za 1 000 društveni bruto proizod će se povećati za 32,86 miliona KM. Prava regresije metode najmanjih kvadrata prolazi kroz srednju tačku dijagrama čije su koordinate aritmetičke sredine analiziranih varijabli X i Y. Zadovoljavanje kriterija minimizacije kvadrata odstupanja podrazumijeva i zadovoljenje prvog kriterija, a to je da zbir rezidualnih odstupanja mora biti jednak nuli. 125

Statistika u ekonomiji i menadžmentu

∑ e = 0 ⇔ ∑ ( y − yˆ ) = 0 ⇔ ∑ y =∑ yˆ i

i

i



i

i

i

i

i

i

1 1 yi = ∑ yˆi ⇔ y = yˆ ∑ n i n i

(3.27)

Zbir rezidualnih odstupanja jednak nuli formalno znači da je aritmetička sredina posmatranih originalnih podataka jednaka aritmetičkoj sredini ocijenjenih podataka. 3.4. MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Da bismo ocijenili reprezentativnost i pouzdanost ocijenjenog modela potrebno je analizirati pokazatelje koji nam to omogućuju. Kao pokazatelje reprezentativnosti analizirat ćemo koeficijent determinacije, koeficijent korelacije, standardnu grešku i koeficijent varijacije regresionog modela. 3.4.1. Koeficijent determinacije Da bismo konstruisali koeficijent determinacije i objasnili njegovo značenje prezentirat ćemo grafički i formalizovati dekompoziciju varijanse. Dekompozicija varijanse promjenljive Y:

yi - y

y yi

yˆ i y

( x, y )

x G rafikon 3.8.

126

yˆ i = a + bx i

xi

Dekom pozicija varijanse

x

Poglavlje 3. – Regresiona i korelaciona analiza

Na osnovu grafikona 3.8. možemo izvršiti sljedeću formalizaciju. Ukupno odstupanje je jednako zbiru objašnjenog i neobjašnjenog odstupanja: ( yi − y ) = ( yˆi − y ) + ( yi − yˆi )

(3.28)

Kako je y = yˆ slijedi: ( yi − y ) = ( yˆi − yˆ ) + ( yi − yˆi )

(3.29)

što omogućava da pokažemo da je ukupna varijansa varijable Y jednaka zbiru objašnjene i neobjašnjene (rezidualne) varijanse:

(

1 1 2 ( yi − y ) = ∑ yˆi − yˆ ∑ n i n i

)

2

+

1 2 ( yi − yˆi ) ∑ n i

(3.30)

Ovaj izraz možemo napisati u sljedećem obliku:

∑( y i − y ) 2 ∑( yˆ i − y ) 2 ∑( y i − yˆ i ) 2 = + n n n

(3.31)

u kojem izraz na lijevoj strani predstavlja ukupnu varijansu, prvi član zbira na desnoj strani objašnjenu a drugi neobjašnjenu varijansu. Gornji izraz možemo napisati u dekomponovanoj formi uvodeći simbole za označavanje objašnjene i neobjašnjene varijanse:

∑( yi − y ) 2 n ∑( yˆi − y ) 2 Objašnjena varijansa : σ 2y / x = n Ukupna varijansa = σ y2 =

Rezidualna (neobjašnjena) varijansa: σ 2yˆ =

(3.32) (3.33)

∑( yi − yˆi ) 2 n

Ukupna varijansa : σ 2y = σ 2y / x + σ 2yˆ

(3.34) (3.35)

Koeficijent determinacije definišemo kao odnos objašnjene i ukupne varijanse:

∑( yˆi − y ) 2 ∑( yˆi − y ) 2 Objašnjena varijansa n r2 = = = Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n

(3.36)

127

Statistika u ekonomiji i menadžmentu

ili pomoću sljedećeg izraza: ∑( yi − yˆi ) 2 ∑( yi − yˆ i ) 2 Neobjašnjena varijansa n (3.37) 1 r2 = 1− = 1− = − Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n

Vrijednost ovog koeficijenta se kreće između nule i jedinice. On pokazuje koja je proporcija ukupne varijacije varijable Y objašnjena ocijenjenom regresionom jednačinom i uobičajeno je da se izražava u procentima. Veća vrijednost ovog koeficijenta ukazuje da je veća proporcija objašnjene u ukupnoj varijaciji i da je odabrani model pouzdaniji i reprezentativniji. Vrijednost koeficijenta determinacije u primjeru 3.1. je bila r2=0,86 što znači da linearni model u kojem je nezavisna (eksplikativna) varijabla proizvodnja u kilogramima objašnjava 86 % varijacije ukupnih prihoda posmatranog preduzeća. 3.4.2. Koeficijent korelacije Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti dvije pojave za koje poznajemo empirijske vrijednosti kvantitatinih varijabli i za koje pretpostavljamo da imaju linearnu vezu. Ovaj koeficijent ne zavisi od jedinica mjere. To je, dakle, neimenovan broj. Koeficijent linearne korelacije je definisan kao odnos kovarijanse varijabli X i Y i proizvoda standardnih devijacija varijable X i varijable Y.

r=

Cov( X , Y ) = σ X ⋅σY

∑ (x

i

∑ (x

i

− x )( yi − y )

− x) ⋅ 2

∑(y

i

− y)

2

(3.38)

Vrijednost koeficijenta linearne korelacije se nalazi između -1 i 1. Veća vrijednost koeficijenta ukazuje na postojanje veće linearne povezanosti između promjenjljivih X i Y. Potrebno je naglasiti da manja vrijednost ovog koeficijenta ne mora uvijek značiti da je slaba korelacija jer se može raditi o pogrešnoj primjeni koeficijenta linearne korelacije za mjerenje jačine veze pojava koje nisu u linearnom odnosu. • Za vrijednosti: -1 < r < 0 korelacija je negativna. • Za vrijednosti: 0 < r < 1 korelacija je pozitivna. 128

Poglavlje 3. – Regresiona i korelaciona analiza



Za vrijednosti –1 i 1, radi se o perfektnoj negativnoj, odnosno pozitivnoj korelaciji.

Koeficijent linearne korelacije možemo izraziti kao kvadratni korijen koeficijenta determinacije:

∑( yˆ i − y ) 2

r = r2 =

∑( y i − y ) 2

(3.39)

ili

r = 1−

∑( y i − yˆ i ) 2 ∑( y i − y ) 2

(3.40)

Koeficijent determinacije možemo izraziti koristeći definiciju koeficijenta linearne korelacije. U tom slučaju koeficijent determinacije izražavamo u sljedećem obliku:

r2 =

Cov 2 ( X , Y ) σ 2 X ⋅ σ 2Y

(3.41)

3.4.3. Standardna greška regresionog modela Pored koeficijenta linearne korelacije i koeficijenta determinacije, kvalitet ocjene se može mjeriti i pomoću standardne greške ocjene regresionog modela i koeficijenta varijacije ocijenjenog regresionog modela. Standardna greška ocijenjenog modela može se nazvati i rezidualnom standardnom greškom jer se definiše na osnovu rezidualnog zbira kvadrata odstupanja i jednaka je kvadratnom korijenu rezidualne (neobjašnjene) varijanse: n

σ yˆ =

∑( y i =1

i

− yˆ i ) 2

n

(3.42)

Standardna greška regresije mjeri kvalitet i reprezentativnost ocijenjenog regresionog modela i pokazuje prosječno odstupanje empirijskih vrijednosti zavisne varijable Y od vrijednosti ocijenjenih regresionim modelom. Standardna greška regresije je apsolutna mjera disperzije oko regresije jer se izražava u istim jedinicama mjere kao zavisna varijabla. 129

Statistika u ekonomiji i menadžmentu

3.4.4. Koeficijent varijacije regresionog modela Koefecijent varijacije ocijenjenog regresionog modela je relativni pokazatelj kvaliteta ocjene i jednak je odnosu standardne greške ocijenjenog regresionog modela i aritmetičke sredine zavisne varijable Y:

kVyˆ =

σ yˆ y

⋅100

(3.43)

Na osnovu vrijednosti ovog koeficijenta možemo procijeniti preciznost i kvalitet ocjene na sljedeći način:



Ako je 7%<



Ako je 4%<



Ako je 1%<



Ako je

σ yˆ y

σ yˆ y

σ yˆ y

σ yˆ y

≤1%

≤ 10% ocjena je dosta dobra ≤ 7%

ocjena je dobra

≤ 4%

ocjena je vrlo dobra ocjena je odlična.

Primjenu ovih parametara za procjenu kvaliteta ocjene ćemo ilustrovati na primjeru na kojem ćemo ocijeniti linearni i više različitih tipova nelinearnih regresionih modela da bismo odabrali model koji najbolje reprezentuje posmatrane podatke. 3.4.5. Aplikacija različitih oblika regresionog modela Na sljedećem primjeru ćemo aplicirati etape konstrukcije regresionog modela i izvršiti ocjenu različitih oblika modela.

130

Poglavlje 3. – Regresiona i korelaciona analiza

3.4.5.1. Linearni model

Primjer 3.3. Tabela 3.6. Godišnja stanarina u KM u 2003. prema veličini stana izraženoj brojem soba u stanu Stan (broj soba) X 1 2 3 4 5 7 Ukupno

Godišnja stanarina Y 1 870 2 480 3 470 4 980 6 900 11 560 31 260

Broj stanova fj 75 500 81 750 35 500 14 000 7 500 7 000 221 250

Statistička jedinica je stan. Podatke iz tabele možemo sintetizirati na sljedeći način: Tabela 3.7. Parametri za analizirane varijable

Aritmetička sredina Standardna devijacija Koeficijent varijacije





Stan (broj soba) 2,206 1,345 0,61

Godišnja stanarina 3 025,99 1 911,11 0,63

Prva etapa je izbor varijabli X i Y. Mi želimo objasniti godišnju stanarinu kao funkciju veličine stana. Varijabla X će predstavljati veličinu stana (broj soba) i to je nezavisna ili eksplikativna varijabla. Varijabla Y je godišnja stanarina i to je zavisna ili varijabla koju trebamo objasniti. Druga etapa je kompletiranje dijagrama rasipanja podataka.

131

Statistika u ekonomiji i menadžmentu 12000 11560

Godišnja stanarina

10000 8000 6900

6000 4980

4000 3470

2000 1870 0

0

1

2480 2

Grafikon 3.9.



3

4 Veličina stana

5

6

7

Dijagram rasipanja

Treća etapa je ocjena regresione prave. Posmatrajući dijagram rasipanja čini nam se, na prvi pogled, da bismo mogli ocijeniti linearnu regresionu jednačinu: yˆ i = a + bxi

Primjenom analiziranih postupaka ocjene dobijamo vrijednost parametara a i b: a = −755,14 i b = 1626,86 , i kompletiramo jednačinu ocijenjene regresione prave:

yˆi = −755,14 + 1626,86 xi Koeficijent linearne korelacije je r=0,9757 i koeficijent determinacije r2=0,9520. Značenje parametara a i b: parametar a predstavlja odsječak na ordinatnoj osi. Ovdje realno nema odsječka na Y osi jer ukoliko nema stanova za izdavanje, nema ni stanarine. Parametar b predstavlja nagib prave i značenje mu je sljedeće: ako se veličina stana poveća za jednu sobu, godišnja stanarina će u prosjeku rasti za 1626,86 KM. • Četvrta etapa je izračunavanje rezidualnih odstupanja. Uvrštavajući vrijednosti xi u gore ocijenjenu jednačinu, izračunat ćemo ocijenjene vrijednosti zavisne varijable. Rezultate računanja predstavljamo u sljedećoj tabeli.

132

Poglavlje 3. – Regresiona i korelaciona analiza

Tabela 3.8. Radna tabela za primjer 3.3.

xi

yi

yˆ i

y i − yˆ i

( y i − yˆ i )2

1 2 3 4 5 7 Ukupno

1 870 2 480 3 470 4 980 6 900 11 560 31 260

871,71 2 498,57 4 125,43 5 752,29 7 379,14 10 632,86 31 260

998,29 -18,57 -655,43 -772,29 -479,14 927,14 0

996 582,92 344,84 429 588,48 596 431,84 229 575,14 859 588,58 3 112 111,80

Pošto je



∑ yi = ∑ yˆi

treba izračunati

∑ ( yi − yˆi )2

Peta etapa: procjena kvaliteta ocijenjene linearne prave - rezidualna standardna devijacija

σ yˆ = -

( yi − yˆi ) 2 3112111,80 = = 720, 20 KM ∑ n 6 i =1 n

koeficijent varijacije regresije:

σ yˆ y

=

720,20 = 0,1382 ⇒ 13,82% 5210

Ova dva parametra imaju visoku vrijednost i ukazuju na vrlo loš kvalitet ocjene. Koeficijent linearne korelacije je r =0,9757 i koeficijent determinacije r2=0,9520. Vrijednost koeficijenta korelacije je blizu jedinici, a koeficijent determinacije znači da je 95,20 % varijabiliteta stanarine objašnjeno varijabilitetom veličina stana. Dakle, na osnovu vrijednosti ova dva koeficijenta mogli bismo zaključiti da je ocjena kvalitetna ali rezidualna standardna devijacija i koeficijent preciznosti ne potvrđuju ovaj rezultat.

133

Statistika u ekonomiji i menadžmentu



Šesta etapa: Analiza rezidualnih odstupanja

Tabela 3.9. Rezidualna odstupanja za primjer 3.3.

xi

Rezidualna odstupanja ( y i − yˆ i )

1 2 3 4 5 7 Ukupno

998,29 -18,57 -655,43 -772,29 -479,14 927,14 0

Kada je ocjena dobra i pouzdana, rezidualna odstupanja su slučajna i imaju malu vrijednost kao što smo već naveli analizirajući njihove osobine. Ako bismo predstavili dijagram rasipanja rezidualnih odstupanja vidjeli bismo da on ne zadovoljava gore navedene uslove i da ima paraboličan oblik. To znači da ocijenjeni linearni model ne možemo prihvatiti kao pouzdan i odbacujemo ga. Zbog toga ćemo ocijeniti nekoliko nelinearnih modela. 3.4.5.2. Eksponencijalni model Jednačina eksponencijalnog modela je:

yˆi = a ⋅ b xi

(3.44)

Ocijenjeni eksponencijalni model je dat sljedećim izrazom7:

yˆi = 1377,32 ⋅ 1,3648 xi Ako se broj soba uveća za jednu sobu, stanarina se prosječno uveća za 36,48%. Da bismo analizirali rezidualnu standardnu devijaciju i koeficijent preciznosti ocjene izračunali smo neophodne podatke na isti način kao u slučaju linearne ocjene i dobili rezidualnu standardnu devijaciju:

7

Ovaj i ostali modeli su ocijenjeni korištenjem programa RATS (Regression Analysis for Time Series). Analizirani modeli mogu biti ocijenjeni korištenjem programa Excel ili digitrona koji imaju odgovarajuće statističke funkcije.

134

Poglavlje 3. – Regresiona i korelaciona analiza

σ yˆ =

( yi − yˆi ) 2 539406,11 = = 299,83 KM ∑ 6 n i =1 n

i koeficijent varijacije:

σ yˆ y

=

299,83 = 0,0575 ⇒ 5,75% 5210

Ova ocjena je pouzdanija nego linearna. 3.4.5.3. Stepeni model Ocjenom jednačine stepenog modela: yˆ i = a ⋅ xib

(3.45)

dobili smo sljedeći rezultat:

yˆi = 1517,195 ⋅ xi0,9299 Kvalitet ocjene smo i u ovom slučaju procijenili standardnom devijacijom modela i koeficijentom varijacije:

σ yˆ = σ yˆ y

=

( y i − yˆ i ) 2 = ∑ n i =1 n

6398464,87 = 1032,67 KM 6

1032,67 = 19,82% 5210

Ova ocjena nije pouzdana zbog visoke standardne devijacije i koeficijenta varijacije. 3.4.5.4. Logaritamski model Jednačinu logaritamskog modela: yˆ i = a + b ⋅ ln xi

(3.46)

smo ocijenili i dobili sljedeći izraz:

yˆ i = 150,497 + 4508,4219 ln xi 135

Statistika u ekonomiji i menadžmentu

Dva parametra koja smo ocijenili i za ostale modele u ovom slučaju imaju sljedeće vrijednosti: n

σ yˆ =

σ yˆ y

=

∑( y i =1

i

− yˆ i )2

n

=

15483442,81 = 1606,42 KM 6

1606,42 = 30,83% 5210

Ni ova ocjena nije pouzdana zbog vrlo visoke vrijednosti standardne devijacije i koeficijenta varijacije. Rezultate dobijenih ocjena predstavljamo u tabeli 3.10. Tabela 3.10. Ocjene za različite regresione modele Model

σ yˆ

Linearni

Eksponencijalni

yˆ i = −755,14 + 1626,86 xi

yˆ i = 1377,32 ⋅ 1,3648 x

720,20 KM

299,83 KM

13,82%

5,75%

σ yˆ y

Model

Stepeni

yˆ i = 1517,195 ⋅ x

σ yˆ σ yˆ y

Logaritamski 0 , 9299 i

yˆ i = 150,497 + 4508,4219 ln xi

1032,67 KM

1606,42 KM

19,82%

30,83%

Na osnovu prezentovanih podataka zaključujemo da je ocjena eksponencijalnog modela najpouzdanija i najkvalitetnija jer ima najmanju standardnu devijaciju i najniži koeficijent varijacije. Eksponencijalni model se u analiziranom slučaju najbolje prilagođava datim podacima i reprezentuje vezu između visine stanarine i veličine stana. 136

Poglavlje 3. – Regresiona i korelaciona analiza

Primjer 3.4. Koeficijent linearne korelacije je mjera linearne korelacije između varijabli. Međutim, linearnu regresiju ne treba koristiti “automatski” uvijek kad dobijemo visok koeficijent linearne korelacije. Neophodno je, kao što smo već i naglasili, nacrtati dijagram rasipanja podataka koji nam može pomoći da vizuelno uočimo da li se radi o linearnoj vezi između dvije posmatrane varijable i da poslije izvršene ocjene provjerimo njen kvalitet izračunavanjem parametara koje smo već analizirali. Analizirat ćemo jedan poznati primjer koji je predložio Anscombe8 i na kojem je ilustrovana primjena linearne regresije na četiri distribucije podataka koje predstavljamo u tabeli 3.11. Tabela 3.11. Primjer četiri distribucije podataka Distribucija A

Distribucija B

Distribucija C

Distribucija D

xi

yi

xi

yi

xi

yi

xi

yi

10 8 13 9 11 14 6 4 12 7 5

8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68

10 8 13 9 11 14 6 4 12 7 5

9,14 8,14 8,74 8,77 9,26 8,1 6,13 3,1 9,13 7,26 4,74

10 8 13 9 11 14 6 4 12 7 5

7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73

8 8 8 8 8 8 8 19 8 8 8

6,58 5,76 7,71 8,84 8,47 7,04 5,52 12,5 5,56 7,91 6,89

Za svaku od četiri navedene distribucije varijabli X i Y izračunali smo sljedeće statističke pokazatelje. n = 11;

x = 9;

y = 7,5; σ x2 = 10; σ y2 = 3,75; Cov ( X , Y ) = 5

Koeficijent korelacije r =0,816.

8

Anscombe, F.J.: Graph in Statistical Analysis, The American Statistican 27, str. 17-21, prema Droesbeke, J.J.: Eléments de Statistiques, Ellipses, Paris, 1977. g., str. 398-399.

137

Statistika u ekonomiji i menadžmentu

Šest izračunatih pokazatelja su jednaki za sve četiri distribucije. Ako bismo posmatrali samo ove parametre i koeficijent linearne korelacije te ocijenili linearnu regresiju za sva četiri slučaja, napravili bismo grešku. Zbog toga uvijek treba prije ocjene analizirati dijagram rasipanja (analiza a priori) i poslije izvršene ocjene analizirati rezidualna odstupanja (analiza a posteriori). Pošto ponekad ni na osnovu dijagrama rasipanja ne možemo precizno odrediti oblik veze, potrebno je izvršiti ocjene više različitih modela i izabrati najpouzdaniju ocjenu na osnovu analiziranih kriterija. Na sljedećim grafikonima predstavljamo dijagrame rasipanja i linearnu pravu koju smo dobili ocijenjujući linearnu regresiju metodom najmanjih kvadrata.

yˆ = 3 + 0,5 x Koeficijent determinacije je jednak r2=0,667.

y

12 10 8 6 4 2 0

0

2

Grafikon 3.10.

138

4

6

8

10

12

A: Dijagram rasipanja i regresiona prava

14

x

16

Poglavlje 3. – Regresiona i korelaciona analiza

y 12 10 8 6 4 2 0

0

2

4

Grafikon 3.11.

6

8

10

12

14

x

B: Dijagram rasipanja i regresiona prava

y 14 12 10 8 6 4 2 0

x 0

2

4

Grafikon 3.12.

6

8

10

12

14

16

C: Dijagram rasipanja i regresiona prava

y

14 12 10

8 6 4 2 0

0

2

Grafikon 3.13.

4

6

8

10

12

14

16

18

20

x

D: Dijagram rasipanja i regresiona prava

139

Statistika u ekonomiji i menadžmentu

Konstatujemo i naglašavamo da je samo u slučaju A moguće prihvatiti i ocijeniti regresionu pravu. Za ostale slučajeve regresiona prava ne prezentuje adekvatno oblak rasipanja. Analiza a posteriori rezidualnih odstupanja u slučajevima B, C i D pokazuje da se u ova tri slučaja ne može prihvatiti ocjena regresione prave i da je potrebno tražiti i ocijeniti neki drugi model. 3.4.6. Spearmanov koeficijent korelacije ranga Za utvrđivanje stepena povezanosti između pojava za koje su podaci dati u obliku modaliteta rang varijable koristi se Spearmanov koeficijent korelacije ranga. Ovaj koeficijent korelacije se označava simbolom rs i određuje korištenjem sljedećeg izraza:

rs = 1 −

6 n( n

2

n

∑d − 1) i =1

2 i

di = r(xi) – r(yi), i=1, 2,...,n.

(3.47) (3.48)

di predstavlja razlike rangova za odgovarajuće parove vrijednosti varijabli ranga. Kao i za koeficijent linearne korelacije, vrijednost koeficijenta korelacije ranga se uvijek kreće između –1 i +1. Zavisnost je potpuna ako je |rs| = 1.

3.5. MODEL VIŠESTRUKE REGRESIJE Model višestruke ili multiple regresije možemo napisati u sljedećem obliku:

Y = f ( X 1 , X 2 ,...., X K ) + e

(3.49)

Zavisna varijabla Y je izražena kao funkcija K nezavisnih varijabli i slučajnog odstupanja e. Ukoliko je funkcionalni dio modela definisan linearnom funkcijom možemo definisati standardni model višestruke linearne regresije sljedećim izrazom:

Y = a + b1 X 1 + b2 X 2 + ... + bK X K + e

(3.50)

odnosno za n vrijednosti:

y i = a + b1 xi1 + b2 xi 2 + ... + bK xiK + ei , i = 1,2,..., n . 140

(3.51)

Poglavlje 3. – Regresiona i korelaciona analiza

Koeficijenti u regresionom modelu imaju sljedeće značenje: parametar a je slobodni, konstantni član koji predstavlja očekivanu vrijednost zavisne varijable Y kada je vrijednost svih K nezavisnih varijabli (X1, X2,...,XK) jednaka nuli. Vrijednost ovog parametra nema uvijek logičko objašnjenje. Parametar bi (i=1,2,....,K) ili regresioni koeficijent pokazuje prosječnu promjenu zavisne varijable Y uslovljenu jediničnim povećanjem nezavisne varijable Xi, uz uslov da ostale nezavisne varijable ostanu nepromijenjene. Pozitivna vrijednost parametra bi ukazuje na proporcionalan odnos varijabli Y i Xi. To znači da rast nezavisne varijable Xi uslovljava rast zavisne varijable Y. Negativna vrijednost koeficijenta bi znači obrnuto proporcionalan odnos zavisne varijable Y i nezavisne varijable Xi. U ovom slučaju smjer promjene nezavisne i zavisne varijable je suprotan, odnosno rast Xi uzrokuje opadanje zavisne varijable Y, a opadanje Xi uzrokuje rast zavisne varijable Y. 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica Koeficijent multiple determinacije je definisan sljedećim izrazom:

RY2;1, 2,.., K =

∑( yˆ i − y ) 2 , 0 ≤ RY2;1, 2 ,..,K ≤ 1 2 ∑ ( yi − y )

(3.52)

Koeficijent multiple linearne korelacije mjeri jačinu varijabiliteta između zavisne varijable i zbirnog varijabiliteta K nezavisnih varijabli. Određuje se kao kvadratni korijen koeficijenta multiple determinacije:

RY ;1, 2,.., K =

∑( yˆ i − y ) 2 , 0 ≤ RY ;1, 2,.., K ≤ 1 ∑ ( yi − y ) 2

(3.53)

ili pomoću izraza:

RY ;1, 2,.., K =

∑( yi − y )( yˆ i − y ) nσ yσ y

(3.54)

Koeficijentu se ne pridružuje predznak jer odnosi između zavisne i nezavisnih varijabli mogu biti raznosmjerni. Koeficijent parcijalne korelacije pokazuje jačinu i smjer veze zavisne varijable Y i j-te nezavisne 141

Statistika u ekonomiji i menadžmentu

varijable uz nepromijenjen uticaj preostalih (K-1) varijabli koje označavamo sa c. Vrijednost ovog koeficijenta se kreće u sljedećim granicama: − 1 ≤ ry ; j ,c ≤ 1 . Koeficijenti parcijalne korelacije prvog reda za K=2 definišu se pomoću koeficijenata jednostavne linearne korelacije na sljedeći način:

ry ;1,2 =

ry ;1 − ry ;2 r1,2 (1 − ry2;1 )(1 − r1,22 )

; ry ;2,1 =

ry ;2 − ry ;1 r1,2 (1 − ry2;2 )(1 − r1,22 )

(3.55)

Pored koeficijenata multiple i parcijalne korelacije, u višedimnzionalnoj regresionoj analizi se primjenjuju i koeficijenti jednostavne linearne korelacije. Ovi koeficijenti se predstavljaju u obliku korelacione matrice: ⎡1 ry1 .... ryK ⎤ ⎢ ⎥ ⎢ r1 y 1 .... r1K ⎥ R = ⎢ r2 y r21 .... r2 K ⎥ ⎢ ⎥ ⎢.......................... ⎥ ⎢ ⎥ ⎣⎢ rKy rK 1 .... 1 ⎦⎥

(3.56)

U prvom redu matrice R se nalaze koeficijenti jednostavne linearne korelacije između zavisne i svake nezavisne varijable. U prvoj koloni su koeficijenti jednostavne linearne korelacije između svake nezavisne i zavisne varijable. Za koeficijente jednostavne linearne korelacije vrijedi osobina simetričnosti. To znači da se vrijednost koeficijenta jednostavne linearne korelacije ne mijenja ako se zamijeni mjesto varijabli: ryj = rjy ,

j = 1,2,...., K .

rjk = rkj ,

j , k = 1,2,...., K .

Iz navedenog zaključujemo da je korelaciona matrica simetrična. Na glavnoj dijagonali se nalaze jedinice, jer je koeficijent jednostavne linearne korelacije jedne varijable sa tom varijablom jednak jedinici. 3.5.2. Analiza numeričkog primjera Na sljedećem primjeru ćemo ilustrovati ocjenu višestrukog regresionog modela i značenje ocijenjenih parametara.

142

Poglavlje 3. – Regresiona i korelaciona analiza

Primjer 3.5. Tabela 3.12. Prihod preduzeća izražen u hiljadama KM (Y), proizvodnja izražena u kilogramima (X1) i troškovi proizvodnje po kg (X2) izraženi u KM.

Y 20 25 25 35 30 35 40

X1 50 100 150 200 250 300 350

X2 280 260 260 248 196 178 160

Ocijenićemo regresioni model Y = a + b1 X 1 + b2 X 2 primjenom Excela. Izlazne tabele Excela nam daju sljedeće rezultate. Tabela 3.13. (a.,b.,c.) Output Excela za multiplu regresiono-korelacionu analizu na primjeru 3.5.

a. SUMMARY OUTPUT REGRESSION STATISTICS Multiple R 0,9528 R Square 0,9078 Adjusted R Square 0,8617 Standard Error 2,6292 Observations 7

b.

Regression Residual Total

df 2 4 6

ANOVA SS MS 272,3485 136,1742 27,6515 6,9129 300

F 19,6986

Significance F 0,0085

143

Statistika u ekonomiji i menadžmentu

c. COEFFICIENTS STANDARD ERROR T- STAT P-VALUE Intercept -20,7251 26,9055 -0,7703 0,4841 X1 0,1130 0,0377 3,0000 0,0399 X2 0,1245 0,0865 1,4389 0,2236

Ocijenjeni regresioni model je:

Y = −20,7251 + 0,1130 X 1 + 0,1245 X 2 Zavisna varijabla Y predstavlja prihod preduzeća izražen u hiljadama KM, varijabla X1 je proizvodnja izražena u kilogramima i varijabla X2 troškovi proizvodnje po kg izraženi u KM. Značenje dobijenih rezultata je sljedeće: konstantni član a = -20,7251. Ukoliko ne bi bilo proizvodnje, niti troškova proizvodnje, očekivani prihod bi bio negativan. Prihod se ne bi ostvarivao, a morale bi se plaćati već preuzete obaveze vezane za pokretanje proizvodnje. Značenje parametra uz varijablu X1 čija je vrijednost 0,1130 je sljedeće: ukoliko se proizvodnja poveća za jedan kg, prihod će se povećati za 1130 KM uz pretpostavku da troškovi po jedinici proizvoda ostaju nepromijenjeni. Koeficijent uz varijablu X2 je jednak 0,1245. Ukoliko bi se troškovi proizvodnje po jedinici proizvoda povećali za 1 KM, prihod bi se povećao za 1245 KM, uz pretpostavku da nivo proizvodnje ostaje nepromijenjen. Koeficijent multiple korelacije R koji predstavlja povezanost izmedu zavisne i dvije nezavisne varijable je jednak R = 0,95. To znači da postoji jaka povezanost između ukupnog prihoda Y i dvije posmatrane nezavisne varijable koje su proizvodanja izražena u kg i troškovi po jedinici proizvodnje. Koeficijent multiple determinacije R2 predstavlja dio varijacije zavisne varijable objašnjen ocijenjenim linearnim regresionim modelom. Njegova vrijednost je R2 = 0,91 što znači da je 91% varijacije prihoda objašnjeno proizvodnjom izraženom u kg i troškovima po jedinici proizvoda. Statistička značajnost regresijskog modela je određena empirijskim F omjerom i odgovarajućom p vrijednosti u tabeli ANOVA. U našem slučaju p = 0,0085 < 0,01 pa zaključujemo da barem jedna od nezavisnih varijabli statistički značajno utiče na vrijednost zavisne varijable uz nivo rizika od 1%. U izlaznoj tabeli Excela prezentovane su i statističke značajnosti 144

Poglavlje 3. – Regresiona i korelaciona analiza

regresionih koeficijanata koje se određuju pomoću t-statistike i pripadajućih p vrijednosti. Za varijablu X1 vrijednost p= 0,0399, a za X2 p=0,2236. Konstatujemo da u ocijenjenom regresionom modelu varijabla proizvodnja u kg statistički značajno utiče na zavisnu varijablu Y zbog toga što je odgovarajuća vrijednost p manja od 0,05. Za drugu varijablu p vrijednost je veća od 0,05 i to znači da uticaj troškova po jedinici proizvodnje u ovom modelu nije statistički značajan.

3.6. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6.

Na kojem kriteriju je bazirana metoda najmanjih kvadrata? Napišite formule za ocjenu parametara a i b regresione prave. Objasnite značenje parametara a i b regresione prave. Definišite i objasnite kovarijansu. Da li je kovarijansa pokazatelj nezavisnosti posmatranih pojava? Koji koeficijenti služe za mjerenje jačine i smjera povezanosti ekonomskih pojava? 7. Definišite i objasnite značenje koeficijenta determinacije. 8. U kojem intervalu se mogu kretati vrijednosti koeficijenta determinacije? 9. Definišite i objasnite koeficijent linearne korelacije? 10. Koje vrijednosti može imati koeficijent linearne korelacije? 11. Definišite varijansu zbira i razlike dvije nezavisne statističke varijable. 12. Definišite varijansu zbira i razlike dvije statističke varijable. 13. Napišite izraz za dekompoziciju ukupne varijanse. 14. Definišite rezidualnu (neobjašnjenu) varijansu. 15. Definišite objašnjenu varijansu.

145

Statistika u ekonomiji i menadžmentu

3.7. RIJEŠENI ZADACI

Zadatak 1. U sljedećoj tabeli su dati podaci o troškovima promocije i prihodu od prodaje proizvoda Z: Godine

1999 2000 2001 2002 2003 2004 2005

Troškovi promocije (u 000 eura) 50 20 10 30 80 100 120

Prihod od prodaje (u 000 eura) 280 220 180 220 320 330 350

Prvi dio: 1. Odredite zavisnu i nezavisu varijablu? 2. Predstavite dijagram rasipanja. Koji tip funkcije se najbolje prilagođava datom dijagramu? 3. Koji je, po vašem mišljenju, znak kovarijanse između dvije posmatrane varijable? 4. Izračunajte jednačinu regresione prave. 5. Predstavite grafički ovu pravu na dijagramu rasipanja. Komentarišite. 6. Izračunajte koeficijent linearne korelacije i koeficijent determinacije i objasnite njihova značenja. 7. Marketing servis predviđa za 2006 godinu budžet za promociju u iznosu od 125000 €. Procijenite prihod od prodaje za 2006 godinu. Komentarišite.

146

Poglavlje 3. – Regresiona i korelaciona analiza

Drugi dio: Godine

Posmatrana prodaja

yi 1999 2000 2001 2002 2003 2004 2005 Ukupno

280 220 180 220 320 330 350 1900

Prodaja procijenjena modelom

( yi − yˆi )2

( yˆi − y )2

yˆi 258,50 213,26 198,18 228,34 303,74 333,90 364,06 1900

462,14 45,40 330,58 69,59 264,28 15,24 197,80 1385,03

167,08 3383,35 5365,09 1856,43 1044,24 3903,15 8581,35 24300,69

1. Provjerite rezultat prve linije gornje tabele za 1999. godinu. 2. Uporedite aritmetičku sredinu posmatranih prodaja i aritmetičku sredinu procijenjenih prodaja. 3. Izračunati neobjašnjenu varijansu i varijansu objašnjenu regresijonom pravom. 4. Provjerite numerički jednakost: Ukupna varijansa = Objašnjena varijansa + Neobjašnjena (rezidualna) varijansa. 5. Provjerite vrijednosti dobijene za koeficijent determinacije u prvom dijelu. Elementi rješenja:

Prvi dio: 1. U ovom primjeru promjenljiva Y, prihod od prodaje proizvoda Z, je zavisna promijenljiva. Posmatramo je kao funkciju nezavisne promjenljive troškovi promocije X.

147

Statistika u ekonomiji i menadžmentu

Prihod

2.

400

yˆ = 1,508 x + 183,1 R 2 = 09461

300 200 100 0

0

20

40

60

80

100

120

140

Troškovi reklame Grafikon 3.14

Dijagram rasipanja i regresiona prava

3. Kovarijansa je pozitivna. 4. yˆ = 183,1 + 1,51x 5. Model linearne regresije se najbolje prilagođava datim podacima. 6. Koeficijent linearne korelacije r je jednak 0,97. To znači da postoji visok stepen linearne korelacije između dvije posmatrane varijable. Vrijednost koeficijenta determinacije je jednaka 0,946 i to znači da je 94,6% varijacije prihoda objašnjeno troškovima promocije.

r= r2 =

Cov( X , Y )

σ XσY Cov 2 ( X ,Y )

σ x2 σ y2

= 0,972 = 0,946

7. Y ocjenjeno za 2006. godinu:

yˆ = 183,1 + 1,51x

yˆ = 183,1 + 1,51 ⋅ 125 = 371,85 Ako bi budžet za promociju u 2006. godini iznosio 125 000 eura, prihod od prodaje u ovoj godini bi bio 371850 eura. 148

Poglavlje 3. – Regresiona i korelaciona analiza

Drugi dio: 1. Y procjenjeno za 1999

yˆ = 183,1 + 1,51 ⋅ 50 = 258,6 2. Aritmetička sredina posmatranih prodaja i aritmetička sredina procijenjenih prodaja su jednake 271,43. 3. Neobjašnjena varijansa:

σ y2 / x =

∑( y i − yˆ i ) 2 1385.03 = = 197.86 n 7

Objašnjena varijansa:

σ

2 y/x

∑( yˆ i − y ) 2 24300.69 = = = 3471.52 n 7

4. Ukupna varijansa: ∑( y − y ) 2 ∑( y i − yˆ i ) 2 ∑( yˆ i − y ) 2 = + = 197.86 + 3471.52 = 3669.38 n n n 5.

r2 =

objašnjena varijansa 3471.52 = = 0.946 ukupna varijansa 3669.38

r2 =1−

neobjašnjena varijansa 197.86 =1− = 1 − 0.0539 = 0.946 ukupna varijansa 3669.38

Zadatak 2. U sljedećoj tabeli posmatramo kretanje varijabli X i Y. Y je zavisna varijabla. Godine 1999 2000 2001 2002 Ukupno

X 0 3 5 8 16

Y 2 5 3 6 16

149

Statistika u ekonomiji i menadžmentu

Poznate su sljedeće vrijednosti: aritmetička sredina varijable X jednaka je 4, varijansa od X jednaka je 8,5, aritmetička sredina varijable Y jednaka je 4, varijansa od Y jednaka je 2,5 i Cov(X, Y)=4. 1. Odrediti jednačinu regresione prave. 2. Izračunati koeficijent determinacije i objasniti ga. Elementi rješenja:

b=

Cov( X , Y )

σ

2 X

=

4 = 0, 47 8,5

a = y − bx = 4 − 0, 47 ⋅ 4 = 2,12 yˆ = 2,12 + 0, 47 x r = 2

Cov 2 ( X , Y )

σ σ 2 X

2 Y

=

4 = 0,188 8,5 ⋅ 2,5

Zadatak 3. Za varijable X i Y poznato je 15 parova vrijednosti (xi, yi). Y je zavisna varijabla. Poznati su sljedeći parametri ove dvije distribucije:

x = 4,

σ X2 = 3.75

y = 4,

σ Y2 = 3

i koeficijent pravca regresione prave: b = - 0.8 1. Odredite jednačinu regresione prave. 2. Izračunajte koeficijent linearne korelacije. 3. Odredite varijansu objašnjenu regresionom pravom. Elementi rješenja:

a = y − bx = 4 + 0,8 ⋅ 4 = 7, 2 yˆ = 7, 2 − 0,8 x r=

150

Cov( X , Y )

σ XσY

Poglavlje 3. – Regresiona i korelaciona analiza

b=

Cov ( X , Y )

σ X2



Cov ( X , Y ) = b ⋅ σ X2 = −0,8 ⋅ 3,75 = −3 r=

Cov ( X , Y )

r2 =

σ XσY

=

−3 = −0,89 3,35

Objašnjena varijansa ⇒ Ukupna varijansa

Objašnjena varijansa = r 2 ⋅ Ukupna varijansa = 0, 79 ⋅ 3 = 2,37

151

POGLAVLJE 4.

DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE

Za istraživanje i analizu promjena pojava u vremenu primjenjuju se metode dinamičke analize. Dinamička analiza omogućava praćenje promjena pojava u vremenu i predviđanje tendencije razvoja pojava.

4.1. APSOLUTNA I RELATIVNA PROMJENA Apsolutna promjena pojave V između datuma t i datuma 0 je jednaka:

ΔV = Vt − Vo

(4.1)

Apsolutna promjena je izražena u jedinicama mjere analizirane varijable. Apsolutna promjena može biti negativna. Relativna promjena veličine pojave V između perioda t i 0 je jednaka:

ΔV Vt − V0 = V V0

(4.2)

153

Statistika u ekonomiji i menadžmentu

Relativna promjena se naziva stopa promjene. Ukoliko je stopa promjene pozitivna naziva se stopa rasta. Stopu promjene možemo izraziti i sljedećom formulom:

ΔV Vt − V0 Vt = = −1 V V0 V0

(4.3)

Izračunavanje i objašnjenje apsolutne i relativne promjene ćemo ilustrovati na primjeru 4.1.

Primjer 4.1. Tabela 4.1. Broj studenata i nastavnog osoblja na fakultetima u Federaciji BiH

Kod za školsku godinu Redovni studenti Vanredni studenti Nastavnici Saradnici Broj fakulteta

1997/98 1998/99 1999/00 (1) (2) (3) 22 697 26 649 28 912 6 451 9 315 11 483 1 250 1 294 1 442 1 080 1 185 1 248 40 48 47

2000/01 (4) 31 861 11 360 860 913 48

2001/02 (5) 32 614 12 192 777 898 48

Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, str.309.

U koloni posmatramo strukturu studenata, nastavnog osoblja i broja fakulteta. U 2001/02 godini je bilo 32 614 redovnih i 12 192 vanredna studenta. Broj nastavnika je bio 777, a saradnika 898. Broj fakulteta je bio 48. Za svaku od posmatranih godina možemo analizirati datu strukturu. Analiza redova u datoj tabeli omogućava istraživanje evolucije analiziranih pokazatelja i struktura u vremenu. Na grafikonima 4.1. i 4.2. je prezentirana struktura posmatranih pokazatelja i njihova evolucija u vremenu.

154

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

35000 30000

redovni studenti

25000

vanredni studenti

20000

nastavnici saradnici

15000 10000 5000 0

1997/98

Grafikon 4.1.

1998/99

1999/00

2000/01

2001/02

Struktura studenata i nastavnog osoblja

35000 30000

1997/98

25000

1998/99

20000

1999/00

15000

2000/01 2001/02

10000 5000 0

redovni

Grafikon 4.2.

vanredni

nastavnici

saradnici

Evolucija broja studenata i nastavnog osoblja

U posmatranom periodu broj studenata, redovnih i vanrednih, je u stalnom porastu. Broj nastavnika i saradnika pokazuje tendenciju opadanja od 1999/00 godine. Koristeći prezentiranu i analiziranu definiciju i izraz za apsolutnu promjenu izračunali smo i prezentirali u narednoj tabeli apsolutne stope promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine.

155

Statistika u ekonomiji i menadžmentu

Tabela 4.2. Apsolutne promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine

Redovni studenti Vanredni studenti Nastavnici Saradnici

ΔV2-1 3 952 2 864 44 105

ΔV3-2 2 263 2 168 146 63

ΔV4-3 2 949 -123 -582 -335

ΔV5-4 753 832 -83 -15

ΔV5-1 9 917 5 741 -473 -182

Najveća apsolutna promjena broja redovnih studenata je bila između 1997/98 i 1998/99 akademske godine. Broj redovnih studenata se u periodu između ove dvije akademske godine povećao za 3952. Najmanja apsolutna promjena je bila između 2000/01 i 2001/02 akademske godine. Broj studenata se povećao za samo 753. Apsolutna promjena broja redovnih studenata između 2001/02 i 1998/99 je bila 9 917 studenata. Ovu apsolutnu promjenu smo izračunali na osnovu definicije apsolutne promjene. Apsolutnu promjenu u ovom periodu možemo izračunati i sabiranjem uzastopnih apsolutnih promjena u posmatranim godinama:

ΔV5-1= ΔV2-1+ΔV3-2+ΔV4-3+ΔV5-4 . Npr. za redovne studente: 9917=3952+2263+2949+753. Na isti način bismo mogli utvrditi apsolutne promjene i za ostale posmatrane kategorije. Apsolutne promjene broja vanrednih studenata su bile pozitivne, osim u periodu između 1999/00 i 2000/01 godine. Apsolutne promjene broja nastavnika i saradnika su bile pozitivne u prve dvije akademske godine, a u naredne dvije godine su bile negativne što ukazuje na to da se broj nastavnika i saradnika smanjio u tim godinama. Broj nastavnika se smanjio za 473 u 2001/02 u odnosu na 1997/98 godinu. U posmatranom periodu, za tri od pet akademskih godina utvrdili smo negativnu apsolutnu promjenu saradnika.

156

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Tabela 4.3. Relativna promjena broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine

Redovni studenti Vanredni studenti Nastavnici Saradnici

V2 − V1 V1

V3 − V2 V2

V4 − V3 V3

V5 − V4 V4

V5 − V1 V1

17,41 44,39 3,52 9,72

8,49 23,27 11,28 5,32

10,20 -1,07 -40,36 -26,84

2,36 7,32 -9,65 -1,64

43,69 88,99 -37,84 -16,85

Relativne promjene redovnih studenata su u svim posmatranim godinama bile pozitivne. U periodu između 1997/98 i 2001/02 godine stopa promjene je dostigla nivo 43,69%. Relativne promjene, odnosno stope promjene se ne mogu sabirati. Stope promjene ne posjeduju osobine računanja. Stopa promjene u periodu između 1998/99 i 2001/02 godine nije jednaka zbiru stopa promjene za pojedine godine posmatranog perioda:

ΔV5 −1 ΔV2 −1 ΔV3− 2 ΔV4 − 3 ΔV5 − 4 ≠ + + + V1 V1 V2 V3 V4 Ovu osobinu stope promjene provjeravamo na primjeru redovnih studenata: 43,69≠17,41+8,49+10,20+2,36=38,48 Najveću stopu rasta konstatujemo kod vanrednih studenata između prve i posljednje posmatrane akademske godine. Stopa rasta je bila 88,99 %. Negativne stope promjene konstatujemo u dva perioda kod nastavnika i saradnika. U 2001/02 u odnosu na 1997/98 godinu broj nastavnika se smanjio za 37,84 %, a broj saradnika za 16,85 %. Da bi analiza bila kompletna, potrebno je istovremeno posmatrati i relativne i apsolutne promjene. U narednom primjeru ćemo grafički ilustrovati, izračunati i analizirati apsolutne i relativne promjene broja nezaposlenih u Federaciji Bosne i Hercegovine prema stručnoj spremi.

157

Statistika u ekonomiji i menadžmentu

Tabela 4.4. Broj nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1998 2 851 2 358 48 383 84 273 10 786 107 836 256 487

VSS VSS SSS VKV, KV PKV, NSS NKV Ukupno

1999 2 635 2 485 49 870 87 852 14 997 103 954 261 793

2000 2 853 2 827 51 684 90 330 15 226 98 853 261 773

2001 3 043 3 236 54 877 95 359 15 965 96 524 269 004

Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, 2002, str.270.

120,000 VSS

100,000

VŠS

80,000

SSS

60,000

VKV, KV

40,000

PKV, NSS

20,000

NKV

0

1998

Grafikon 4.3.

1999

2000

2001

Struktura nezaposlenih prema stručnoj spremi u Federaciji BiH

120,000 100,000 1998

80,000

1999

60,000

2000

40,000

2001

20,000 0

VSS

Grafikon 4.4.

158

VŠS

SSS

VKV, KV

PKV, NSS

NKV

Evolucija broja nezaposlenih u Federaciji BiH prema stručnoj spremi

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Tabela 4.5. Apsolutne promjene broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1999/98 -216 127 1 487 3 579 4 211 -3 882 5 306

VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno

2000/99 218 342 1814 2 478 229 -5101 -20

2001/00 190 409 3 193 5 029 739 -2 329 7 236

2001/98 192 878 6494 11 086 5 170 -11312 12 517

15000

Absolutna promjena

10000 5000 NKV 0 -5000

VSS

-10000

VŠS

1998/99

SSS

VKV, KV

1999/00

2000/01

PKV, NSS

1998/01

-15000

Grafikon 4.5.

Absolutne promjene broja nezaposlenih u Federaciji BiH

Tabela 4.6. Relativna promjena broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi u %

VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno

1999/98 -7,58 5,38 3,07 4,25 39,04 -3,60 2,07

2000/99 8,27 13,76 3,64 2,82 1,53 -4,91 -0,008

2001/00 6,66 14,47 6,18 5,57 4,85 -2,36 2,76

2001/98 6,73 37,23 13,42 13,15 47,93 -10,49 4,88

159

Relativna stopa promjene

Statistika u ekonomiji i menadžmentu % 60

1999/98

50

2000/99

2001/00

2001/98

40 30 20 10 0 -10

VSS

VŠS

SSS

VKV, KV

PKV, NSS NKV

-20 Grafikon 4.6.

Relativne stope promjene nezaposlenih u Federaciji BiH u %

Na osnovu izračunatih i prezentiranih parametara i njihovih grafičkih prikaza možemo dati kompletnu analizu evolucije nezaposlenih osoba prema stručnoj spremi. Grafički prikazi koje smo kompletirali su ilustrativniji od desetine rečenica jer nam omogućavaju vizuelno posmatranje promjena i u strukturi i u evoluciji nezaposlenih u posmatranom periodu. Zapažamo da je došlo do porasta broja nezaposlenih više i srednje stručne spreme, kao i svih kategorija kvalifikovanih radnika. Jedino smanjenje broja nezaposlenih bilježe nekvalifikovani radnici. Ove konstatacije potvrđuju i izračunate relativne promjene.

4.2. INDEKSI Statistička analiza razlikuje apsolutne i relativne promjene. Termin relativne promjene se razvio na više nivoa u slučajevima kada se porede različite veličine u prostoru i vremenu. Za opis i poređenje evolucije pojava i varijabli čiji je red veličina različit najčešće se koriste indeksi. Indeks je broj koji objašnjava relativnu promjenu jednostavne ili kompleksne veličine između dva perioda, od kojih se jedan odabire kao bazni period. Kako je indeks odnos između dvije veličine iste prirode, on ne posjeduje jedinicu mjere. Indeks je, dakle, neimenovan broj.

160

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Najpoznatija dihotomija ideksa je na individualne (elementarne, proste) i agregatne (sintetičke) indekse. • Individualni indeksi se primjenjuju u slučaju kada želimo analizirati homogene veličine. Individualni indeksi se konstruišu tako da fiksiramo bazni period i izračunavamo promjenu posmatrane veličine između posmatranog perioda, koji ćemo označiti sa t, i baznog perioda, koji označavamo sa 0. Individualni indeks je bazni elemenat statističke analize hronoloških serija. • Agregatni indeksi se baziraju na istim principima, ali se primjenjuju za analizu heterogenih veličina. Neki od njih služe kao referentni indeksi. Najpoznatiji su indeksi vrijednosti, indeksi cijena, indeksi fizičkog obima proizvodnje, indeksi troškova života, berzni indeksi (Dow Jones, CAC 40), itd. Njihova konstrukcija je tehnički i metodološki vrlo komplikovana što ponekad otežava njihovo tumačenje. Praktična korisnost indeksa dolazi posebno do izražaja ako se analiza vrši za duži period. Fiksira se bazna godina za koju je indeks jednak 1 (ili 100), zatim se računaju indeksi za svaku godinu. Ukoliko su indeksi veći od 100, posmatrana pojava je relativno rasla u odnosu na bazni ili prethodni period. Kada su indeksi manji od 100, analizirana pojava je opadala u odnosu na bazni ili prethodni period. Indeksi nam pružaju direktno sintetički pogled na evoluciju u odnosu na bazni ili prethodni period i omogućavaju praćenje promjena analiziranih veličina između svih posmatranih perioda. 4.2.1. Individualni indeksi Individualni indeks se primjenjuje za analizu promjena u vremenu posmatrane veličine, kao i za poređenje evolucije više različitih veličina. Indeksi se mogu izraziti u odnosu na bazu 1 ili 100. Za izračunavanja se, iz praktičnih razloga, koriste indeksi u bazi 1. Konačni rezultati se prezentiraju u formi indeksa čija je baza 100 ili u obliku stope promjene u procentima. Indeks nema jedinice mjere. Indeks je, kao što smo već naveli, neimenovan broj koji ima veliku praktičnu upotrebu. Individualni indeksi se mogu izračunavati na osnovu stalne i promjenljive baze.

161

Statistika u ekonomiji i menadžmentu

4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) Bazne indekse ili indekse sa stalnom bazom izračunavamo kao količnik između veličine analizirane pojave u posmatranom i odabranom baznom periodu. Da bismo izračunali indeks sa stalnom bazom potrebno je prvo odabrati baznu godinu za koju indeks ima vrijednost 1 (ili 100). Ako sa Vt označimo veličinu analizirane pojave u periodu t i sa V0 označimo veličinu analizirane pojave u baznom periodu, individualni indeks između ta dva perioda ćemo izračunati na sljedeći način:

it / 0 =

Vt V0

(4.4)

Individualni indeks veličine V za period t u odnosu na bazni period 0 ako je baza 100 u periodu 0 je dat sljedećim izrazom:

I t / 0 = it / 0 ⋅ 100 =

Vt ⋅ 100 9 V0

(4.5)

Bazni indeksi se definišu kao indeksi razvoja. Ovi indeksi su pokazatelj razvoja pojava u posmatranom periodu u odnosu na bazni period. Bazni indeksi se koriste i za poređenja razvoja više pojava. Indeksi sa stalnom bazom se koriste za analizu i poređenja na isti način kao i originalni podaci o vrijednostima posmatranih pojava. Razlika između dva bazna indeksa je pokazatelj indeksnih poena. Na bazi podataka iz tabele 4.4., izračunali smo bazne indekse nezaposlenih osoba prema stručnoj spremi. Za bazu smo odabrali 1998. godinu. Izračunate indekse prezentujemo u tabeli 4.7.

9

Sa malim i označavamo proste indekse ako su izraženi u bazi 1. Množenjem ovih indeksa sa 100 dobijamo indekse izražene u bazi 100 i označavamo ih sa velikim slovom I.

162

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Tabela 4.7. Bazni indeksi I t / 0

I1998 100 100 100 100 100 100 100

VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno

I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07

I00/98 100,07 119,89 106,82 107,19 141,16 91,67 102,06

I01/98 106,73 137,23 113,42 113,15 148,02 89,51 104,88

Indeks nezaposlenosti za visoku stručnu spremu u 1999.g. baza 100 u 1998.g. je jednak 92,42. To znači da je nezaposlenost VSS u tom periodu opala za 7,58 %. Indeks nezaposlenosti VSS u 2001. baza 100 u 1998.g. je 106,73. Stopa rasta nezaposlenosti VSS u ovom periodu je bila 6,73%. Indeks ukupnog broja nezaposlenih u periodu 1998.-2001. godine je bio 104,88. U ovom periodu ukupan broj nezaposlenih je porastao za 4,88%. Po analogiji sa datim objašnjenjima mogli bismo analizirati i ostale podatke iz tabele 4.7. za sve kategorije nezaposlenih u posmatranim periodima. Na dva grafikona koji slijede smo predstavili bazične indekse nezaposlenih osoba visoke stručne spreme (VSS). 110

106,73

105 100

100

95

100,07

92,42

90 85

1998

Grafikon 4.7.

1999/98

2000/98

2001/98

Bazni indeksi broja nezaposlenih VSS baza 100 u 1998.g.

163

Statistika u ekonomiji i menadžmentu

110

106,73

105

100

100

100,07

95

92,42 90

1999/98

1998

Grafikon 4.8.

2000/98

2001/98

Bazni indeksi broja nezaposlenih VSS, baza 100 u 1998. godini

2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) Indeksi sa promjenljivom bazom predstavljaju odnose veličine pojave u posmatranom i prethodnom periodu. Da bismo konstruisali indekse sa promjenljivom bazom ili lančane indekse kao bazni period odabiremo svaki put prethodni period. Indekse sa promjenljivom bazom izračunavamo tako da za bazu uzimamo svaki put podatke iz prethodnog perioda. Lančani indeks veličine V u periodu t u odnosu na period (t-1) ako je baza 1 u periodu (t-1) je jednak:

it / t −1 =

Vt Vt −1

(4.6)

Lančani indeks veličine V za period t u odnosu na period (t-1) ako je baza 100 u periodu (t-1) je jednak:

I t / t −1 = it / t −1 ⋅ 100 =

Vt ⋅ 100 Vt −1

(4.7)

Ovi indeksi se nazivaju i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene posmatrane pojave u odnosu na prethodni period. Koristeći podatke iz tabele 4.4. izračunali smo lančane indekse nezaposlenih osoba prema stručnoj spremi. Izračunate indekse prezentujemo u tabeli 4.8.

164

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Tabela 4.8. Lančani indeksi I t/t-1

VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno

I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07

I00/99 108,27 113,76 103,64 102,82 101,53 95,09 99,99

I01/00 106,66 114,47 106,18 105,57 104,85 97,64 102,76

Ukupan broj nezaposlenih se povećao u 1999. u odnosu na 1998. godinu za 2,07%. Između 1999. i 2000.g. broj nezaposlenih je ostao skoro nepromijenjen. U periodu 2000.-2001. godina ukupan broj nezaposlenih se povećao za 2,76%. Na sljedećem grafikonu su predstavljeni lančani indeksi nezaposlenih visoke stručne spreme (VSS). 110 108 106 104 102 100

1998

98

1999

2000

2001

96 94 92 90

Grafikon 4.9.

Lančani indeksi nezaposlenih VSS

Koristeći podatke o broju diplomiranih studenata na ekonomskim fakultetima i Fakultetu za poslovni menadžment u Sarajevu izračunali smo bazne i lančane indeksa koje zajedno sa podacima predstavljamo u sljedećoj tabeli.

165

Statistika u ekonomiji i menadžmentu

Tabela 4.9. Broj diplomiranih studenata na E.F., bazni i lančani indeksi Godine 1998 1999 2000 2001 2002 Ukupan broj studenata 581 484 532 665 462 Žene 345 273 310 373 275 Procenat žena po godinama 59,38% 56,40% 58,27% 56,09% 59,52% Bazni indeksi (1998) - Ukupno 100 83,30 91,57 114,46 79,52 83,30 109,92 125,00 69,47 Lančani indeksi -Ukupno 100 79,13 89,86 108,12 79,71 Bazni indeksi (1998) - Žene 79,13 113,55 120,32 73,73 Lančani indeksi - Žene Izvor: Statistički godišnjak Bosne i Hercegovine 2005., Federalni zavod za statistiku, Sarajevo, str. 295.

Na sljedećim grafikonima smo prezentirali bazne i lančane indekse za ukupan broj studenata, kao i bazne i lančane indekse za žene. 120 110 100 90

114.46 100 91.57

80

83.30

79.52

70 60

1998

Grafikon 4.10.

166

1999

2000

2001

2002

Bazni indeksi ukupnog broja studenata sa bazom u 1998. godini

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

130 120 110 100

1998

2001 1999

90

2000

80 70

2002

60 50 Grafikon 4.11.

Lančani indeksi ukupnog broja studenata u periodu od 1998. do 2002. g.

120 108,12

110 100

100

90 89,86

80 70 60

79,71

79,13

1998

Grafikon 4.12.

1999

2000

2001

2002

Bazni indeksi broja studentica sa bazom u 1998.g.

167

Statistika u ekonomiji i menadžmentu

130 120 110 100

1998 1999

90

2000

2001 2002

80 70 60 50 Grafikon 4.13.

Lančani indeksi broja studentica u periodu od 1998. do 2002. godine

Primjer 4.2. Na osnovu podataka datih u tabeli 4.10.a. izračunati i grafički predstaviti bazne indekse (baza 1997. godina), lančane indekse i prosječnu godišnju stopu promjene društvenog proizvoda Bosne i Hercegovine u periodu 19972001. Tabela 4.10.a. Društveni bruto proizvod BiH u milionima KM

DBP

1997.

1998.

1999.

2000.

2001.

6367

7244

8604

9611

10480

Izvor: Statistički bilten broj 1., Agencija za statistiku BiH, 2003., str. 20.

Bazni indeksi su predstavljeni u sljedećoj tabeli i grafikonima.

8604 ⋅100 = 135,13 . Stopa rasta DBP između 1997. i 6367 1999. je bila 35,13%. Naprimjer: I 99 / 97 =

168

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Tabela 4.10.b. Bazni indeksi za društveni bruto proizvod BiH u milionima KM

180 160 140 120 100 80 60 40 20 0

I 97

I 98/97

I 99/97

I 00/97

I 01/97

100

113,77

135,13

155,95

164,60

135,13 100,00

1997

150,95

164,60

113,77

1998

1999

2000

2001

Grafikon 4.14. Bazni indeksi DBP BiH baza 100 u 1997. godini

180 160 140 120 100 80 60 40 20 0

1997

Grafikon 4.15.

1998

1999

2000

2001

Bazni indeksi DBP BiH baza 100 u 1997. godini

Na osnovu podataka iz tabele 4.10.a. izračunali smo seriju lančanih indeksa društvenog proizvoda Bosne i Hercegovine baza 100 u periodu (t-1).

169

Statistika u ekonomiji i menadžmentu

I 99 / 98 =

8604 ⋅100 = 118,77 7244

Tabela 4.10.c. Lančani indeksi za društveni bruto proizvod BiH u milionima KM

I 97/96

I 98/97

I 99/98

I 00/99

I 01/00

-

113,77

118,77

111,70

109,04

120

115

118,77

113,77 111,7 109,04

110

105

1998/97

Grafikon 4.16.

1999/98

2000/99

2001/00

Lančani indeksi DBP BiH baza 100 (t-1)

Primjer 4.3. U narednoj tabeli i grafikonu predstavljamo podatke o indeksima cijena na malo i indeksima troškova života u Federaciji BiH. Tabela 4.11. Indeksi cijena na malo u Federaciji BiH 1999 1998

2000 1999

2001 2000

2002 2001

2003 2002

2004 2003

Indeksi cijena na malo

99,1

101,2

101,7

99,8

100,2

99,7

Indeksi troškova života

99,3

101,4

102,1

101,0

100,6

100,0

Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str. 260. i 262.

170

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Indeksi cijena na malo Indeksi troškova života

103 102 101 100 99 98

1999/98

2000/99

Grafikon 4.17.

2001/00

2002/01

2003/02

2004/03

Indeksi cijena i troškova života

4.2.2. Osobine indeksa



Indeks ostaje nepromijenjen ako se posmatrana veličina ne mijenja. Ova osobina se naziva osobina identiteta. Ako je Vt=V0, odgovarajući indeksi ostaju nepromijenjeni tj. it/0= i0/0=1



(4.8)

Osobina tranzitivnosti je izražena sljedećom relacijom:

it / 0 = it / t ' ⋅ it ' / 0 =

Vt Vt ' Vt ⋅ = Vt ' V0 V0

(4.9)

Ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak odnosu veličine pojave u posmatranom i baznom periodu. Ova osobina se može generalizirati na seriju sukscesivnih indeksa. Naprimjer, vrijednost indeksa u periodu t = 4 u odnosu na bazni period 0 (i4/0) je jednaka proizvodu uzastopnih indeksa u prethodnim periodima:

i4 / 0 = i4 / 3 ⋅ i3 / 2 ⋅ i2 / 1 ⋅ i1 / 0 =

V4 V3 V2 V1 V4 ⋅ ⋅ ⋅ = V3 V2 V1 V0 V0

171

Statistika u ekonomiji i menadžmentu

Koristeći izraz:

it / t ' =

it / 0 it ' / 0

(4.10)

možemo porediti posmatranu veličinu u periodima t i t’. • Osobina recipročnosti se može definisati u odnosu na vrijeme. Ova osobina kaže da je recipročan indeks neutralan u odnosu na vrijeme. To znači da se promjena baznog datuma predstavlja inverznom formulom:

it / 0 =

1 i0 / t

⇒ it / 0 ⋅ i 0 / t = 1

(4.11)

Za t =1 gornja formula ima sljedeći oblik:

i1 / 0 =

1 i0 / 1

⇒ i1 / 0 ⋅ i0 / 1 = 1

(4.12)

Inverzijom baznog i tekućeg perioda ostvaruje se recipročnost indeksa. Recipročnost indeksa ne znači da su procenti rasta i opadanja identični. Posmatrajmo indeks čija je vrijednost jednaka 1 u baznom i 1,5 u periodu 1:

i1 / 0 = i0 / 1 =

V1 1,5 = = 1,5 V0 1 1 i1 / 0

=

1 = 0,67 1,5

Rast između datuma 0 i 1 je 50%. Opadanje između 1 i 0 je 33%.



Osobina cirkularnosti. Kada su zadovoljene osobine tranzitivnosti i recipročnosti definisana je i osobina cirkularnosti:

it / t ' ⋅ it '/ 0 ⋅ i0 / t = it / 0 ⋅ i0 / t = 1, odnosno Vt Vt ' V0 Vt ⋅ ⋅ = =1 Vt ' V0 Vt Vt ili

172

(4.13)

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

i2 /1 ⋅ i1/ 0 ⋅ i0 / 2 = i2 / 0 ⋅ i0 / 2 = 1, odnosno (4.14)

V2 V1 V0 V2 ⋅ ⋅ = =1 V1 V0 V2 V2

Na osnovu tranzitivnosti, proizvod prva dva člana je jednak i2/0. Na osnovu recipročnosti i2/0 × i0/2=1.

Primjer 4. 4. Primjena osobina indeksa na primjeru iz tabele 4.7. za visoku stručnu spremu (VSS) i ukupan broj nezaposlenih:

VSS Ukupno

I 99/98

I 00/99

I 01/00

I 01/98

92,42

108,27

106,66

106,73

102,07

99,99

102,76

104,88

Da bismo izračunali indeks nezaposlenih VSS u periodu od 1998. do 2001. godine na osnovu lančanih indeksa za prethodne tri godine primijenićemo osobinu tranzitivnosti indeksa:

i01 / 98 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 =

V01 V00 V99 V01 ⋅ ⋅ = V00 V99 V98 V98

i01/ 98 = 1,0666 ⋅1,0827 ⋅ 0,9242 = 1,0673 I 01/ 98 = i01/ 98 ⋅100 = 106,73 Primjenom osobine tranzitivnosti smo izračunali i indeks ukupnog broja nezaposlenih u istom periodu i rezultat upisali u gornju tabelu.



Primjena indeksa u izračunavanju stope promjene

Stopu promjene smo definisali sljedećim izrazom:

ΔV Vt − V0 Vt = = −1 V V0 V0

173

Statistika u ekonomiji i menadžmentu

Pošto je indeks na bazi 1 jednak it / 0 =

Vt izraz za stopu promjene možemo V0

napisati na sljedeći način:

ΔV Vt − V0 Vt = = − 1 = it / 0 − 1 V V0 V0

(4.15)

Stopa promjene koju možemo označiti sa s je jednaka razlici između indeksa u bazi 1 jedinice:

s=

ΔV = it / 0 − 1 V

(4.16)

Indeks u bazi 1 je jednak zbiru stope promjene i jedinice. Pošto stope promjene ne posjeduju osobine računanja, u izračunavanju stopa potrebno je koristiti indekse u bazi 1, a konačni rezultat se može izraziti ili u bazi 100, ili kao stopa promjene u procentima. Na osnovu izračunatih relativnih promjena broja nezaposlenih osoba visoke stručne spreme (u %) u Federaciji BiH prezentovanih u tabeli 4.6. izračunat ćemo stopu promjene broja nezaposlenih u periodu 1998/2001. Dakle, na osnovu sljedećih podataka

VSS

1999/98

2000/99

2001/00

-7,58

8,27

6,66

2001/98

ćemo izračunati traženu stopu. Kako stope promjene nemaju nikakvu osobinu računanja potrebno je primijeniti indekse na bazi 1. Na osnovu podataka iz gornje tabele, računamo proste indekse za tri posmatrana perioda. Prvo stope promjene izrazimo u obliku decimalnih brojeva, a zatim primijenimo vezu prema kojoj je indeks u bazi 1 jednak stopi promjene uvećanoj za jedinicu. Ovim postupkom smo dobili sljedeće rezultate:

i99 / 98 = −0,0758 + 1 = 0,9242 i00 / 99 = 0,0827 + 1 = 1,0827 i01 / 00 = 0,0666 + 1 = 1,0666 174

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Primjenom osobine tranzitivnosti računamo indeks za traženi period:

i01/ 98 = i99 / 98 ⋅ i00 / 99 ⋅ i01/ 00 = 0,9242 ⋅1,0827 ⋅1, 0666 = 1, 06727 ≈ 1, 0673 Da bismo izračunali stopu promjene, broja nezaposelnih u periodu 19982001, koristiti ćemo vezu između indeksa i stope promjene. U ovom primjeru stopa promjene je jednaka indeksu u bazi jedan umanjenom za jedinicu: 1,0673-1=0,0673. Ako rezultat želimo izraziti u procentima pomnožićemo ga sa 100. U periodu između 1998. i 2001.g., broj nezaposelnih sa visokom stručnom spremom se povećao za 6,73%. Stope promjene se ne mogu sabirati. Zbir stopa promjene u uzastopnim periodima ne daje stopu promjene u periodu koji sadrži te uzastopne periode. Npr. stope promjene od –7,58 zatim 8,27 i 6,66 ne uvećavaju nezaposlenost za 7,35% = (–7,58 + 8,27 + 6,66) nego kao što smo izračunali za 6,73%.



Prosječna godišnja stopa promjene

Pretpostavimo da veličina V raste po godišnjoj stopi r. Označimo njenu vrijednost u periodu 1, dakle, u polaznoj godini, sa V1. Godinu poslije vrijednost veličine V će biti jednaka: V2 =V1 + V1 · r = V1 (1+r)

(4.17)

Ako se rast nastavi po istoj stopi, u periodu 3 ćemo imati: V3 =V2 + V2 ·r = V2 (1+r) = V1 (1+r)2

(4.18)

Poslije t godina veličina će biti jednaka: Vt = V1 (1+r)t-1

(4.19)

(1 + r )t −1 = (1 + r ) = t −1 r = t −1

Vt V1

Vt V1

(4.20)

Vt − 1 = t −1 it /1 − 1 V1 175

Statistika u ekonomiji i menadžmentu

Vt se naziva prosječan indeks promjene i predstavlja geometrijsku V1 sredinu lančanih indeksa. Prosječna godišnja stopa promjene je jednaka prosječnom godišnjem indeksu promjene umanjenom za jedinicu. Ukoliko stopu promjene želimo izraziti u procentima, izraz za stopu promjene ćemo pomnožiti sa 100: Izraz

t −1

⎛ V ⎞ r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎝ V1 ⎠

(

t −1

)

it /1 − 1 ⋅100

(4.21)

Prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa umanjenoj za jedinicu. Ova formula može biti korištena direktno ukoliko poznajemo prosječni godišnji indeks ili vrijednosti posmatrane varijable u posmatranim periodima10. Izraz za prosječnu godišnju stopu možemo napisati i u razvijenom obliku:

⎛ V ⎞ ⎛ V V ⎞ V r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎜⎜ t −1 t ⋅ t -1 ⋅⋅⋅ 2 − 1⎟⎟ ⋅100 ⎝ V1 ⎠ ⎝ Vt -1 Vt -2 V1 ⎠

( =( =

Izraz (1 + r )t −1 =

)

t −1

it / t -1 ⋅ it −1/ t − 2 ⋅⋅⋅ i2 /1 − 1 ⋅100

t −1

it /1 − 1 ⋅100

)

(4.22)

Vt možemo korištenjem logaritama izraziti u sljedećem V1

obliku:

(t − 1) ⋅ log (1 + r ) = log log (1 + r ) =

10

Vt V1

log Vt − log V1 t −1

Ovu vrijednost može biti izračunata direktno korištenjem digitrona ili primjenom logaritama.

176

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

⎛ log Vt − log V1 ⎞ (1 + r ) = anti log ⎜ ⎟ t −1 ⎝ ⎠ ⎛ log Vt − log V1 ⎞ r = anti log ⎜ ⎟ −1 t −1 ⎝ ⎠

(4.23)

i izračunati korištenjem logaritama. Period t za koji bi se dostigao planirani nivo veličine V se izračunava na sljedeći način:

r = t −1

Vt −1 V1

r + 1 = t −1

Vt V1

log(r + 1) = t=

1 (log Vt − log V1 ) t −1

(log Vt − log V1 ) log(r + 1)

+1

(4.24)

Primjer 4.5. Da bismo na osnovu podataka iz tabele 4.10. izračunali prosječnu godišnju stopu promjene društvenog proizvoda BiH u periodu 1997.-2001. potrebno je prvo izračunati indekse na bazi 1, a zatim izračunati prosječan godišnji indeks u periodu 1997.-2001. i na osnovu tog podatka, izračunati prosječnu godišnju stopu promjene. Godišnji indeks u periodu 1997.-2001. je jednak:

i01 / 97 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 i01/ 97 = 1,0904 ⋅1,1170 ⋅1,1877 ⋅1,1377 = 1,646 Prosječni godišnji indeks dobijamo na sljedeći način:

i = 4 1,6460 = 1,64601/ 4 = 1,1327

177

Statistika u ekonomiji i menadžmentu

Prosječni godišnji indeks je 1,1327. Prosječna godišnja stopa rasta je bila 13,27%. Dakle, prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa (baza 1) umanjenoj za jedinicu za posmatrani period: r01 / 97 = 4 i01 / 97 − 1 = 4 i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 = 4 1,0904 ⋅ 1,1170 ⋅ 1,1877 ⋅ 1,1377 − 1 = 4 1,6460 − 1 = 1,1327 − 1 = 0,1327

Prosječna godišnja stopa rasta društvenog proizvoda u periodu 1997.-2001. godina je bila 13,27%. Utvrđivanje prosječne godišnje stope promjene r možemo formalizirati i na sljedeći način:

r = 4 i01/ 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 =

4

V01 V00 V99 V98 ⋅ ⋅ ⋅ −1 V00 V99 V98 V97

=

4

V01 − 1 = 4 i01/ 97 − 1 V97

= 4 1, 646 − 1 = 1,1327 − 1 = 0,1327 Primjer 4.6. Odrediti prosječnu godišnju stopu promjene ako agregatni pokazatelj V raste 10% prve godine, 20% druge, 25% treće i 40% četvrte godine.

Vt = V1 (1 + r )

t −1

= V1 (1 + r )

4

Vt = V1 (1 + 0,1) ⋅ (1 + 0, 2 ) ⋅ (1 + 0, 25) ⋅ (1 + 0, 40 )

(1 + r )4 = (1,1) ⋅ (1,2) ⋅ (1,25) ⋅ (1,40) = 2,31 (1 + r ) = 4 2,31 = 2,311 / 4

(1 + r ) = 1,23 r = 0,23 178

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

ili

log(1 + r ) =

log 2,31 = 0,0909 4

(1 + r ) = anti log 0,0909 (1 + r ) = 1,23 r = 0,23 r = 23% Prosječna godišnja stopa rasta je bila 23%.

Primjer 4.7. Veličina V se uvećala u prvoj godini 20%, a u drugoj godini se smanjila za 20%. a) Koliko se veličina V promijenila u toku dvije godine? b) Kolika je prosječna godišnja stopa promjene? c) Ako se veličina V uvećala za 20% prve godine, koliko treba da se promijeni u drugoj godini da bi dostigla nivo iz prve godine? a) V2 = V1 ⋅ (1 + 0, 2 )

V3 = V2 ⋅ (1 − 0, 2 ) = ⎡⎣V1 ⋅ (1 + 0, 2 ) ⋅ (1 − 0, 2 ) ⎤⎦ V3 = V1 ⋅ (1, 2 ) ⋅ ( 0,8 ) = V1 ⋅ 0,96 Veličina V je opala za 4% u toku dvije godine. b) V3 = V1 (1 + r )

2

(1 + r )2 = 0,96 1 + r = 0,9798 r = -0,0202 r = -2,02% Prosječna godišnja stopa promjene je jednaka -2,2%. 179

Statistika u ekonomiji i menadžmentu

Ili r = i2 /1 ⋅ i1/ 0 − 1 = 0,8 ⋅ 1,2 − 1 = 0,96 − 1 = 0,9798 − 1 = −0,0202 r = −2,02%

c) V3 = V2 (1 + r )

V2 = V1 ⋅1, 20 Slijedi:

V3 = V1 ⋅1, 20 ⋅ (1 + r ) ⇒ 1, 20 ⋅ (1 + r ) = 1 ⇒ (1 + r ) =

1 20

1 −1 1,20 r = −0,1666 r=

Poslije povećanja od 20% V se mora smanjiti za 16,66% da bi dostigao svoj nivo iz baznog perioda.

Primjer 4.8. U periodu 1993.-2002. stopa poreza je rasla u apsolutnom iznosu 1% svake godine, a u 2003. i 2004. godini je rasla za 0,5% godišnje. U 2005.g. je opala za 1%. U 2002. stopa poreza je bila 44%. a) Izračunati prosječnu godišnju stopu poreza između 1993. i 2005. b) U kojoj godini bi ova stopa bila veća od 50%?

Rješenje: a) U 1993: 0, 44 − 0, 09 = 0,35 U 2004: 0,44 + 0,01 = 0,45 U 2005: 0,45 − 0,01 = 0,44

r = 12

0, 44 − 1 = 12 1, 2571 − 1 = 1, 0193 − 1 ⇒ r = 1,93% 0,35

b) U 2005.g. r = 44%. Ova stopa će biti veća od 50%, t godina poslije 2005.g. ako se uvećava po prosječnoj stopi od 1,93% godišnje.

180

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

0, 44 ⋅ (1, 0193)

(1, 0193) t −1 =

t −1

=

t −1

= 0,50

0,50 = 1,1364 0, 44

log1,1364 = 6, 68 ⇒ t = 7, 78 ≈ 8 godina log1, 0193

Stopa bi bila veća od 50% u 2013. godini.

Primjer 4.9. Veličina V je rasla po istoj stopi u toku 3 godine. U 2002. je bila 2000 €, a u 2005. 2662 €. Koja je bila prosječna godišnja stopa rasta?

r = t −1

Vt 2662 −1 = 3 −1 V1 2000

r = 3 1,331 − 1 = 1,1 − 1 = 0,10 r = 10% ili

log 2662 − log 2000 3 log(1 + r ) = 0,04139 (1 + r ) = anti log 0,04139 log(1 + r ) =

(1 + r ) = 1,10 ⇒ r = 0,10 ⇒ 10% 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne Lančani indeksi se pretvaraju u bazne postupkom postepenog množenja indeksa prema sljedećem izrazu:

⎧100, t = b = 1 It /0 = ⎨ ⎩ I ( t −1) / 0 ⋅ it /( t −1) , t = 2,3,.., n.

(4.25)

181

Statistika u ekonomiji i menadžmentu

Lančani indeksi mogu se pretvarati u indekse na stalnoj bazi vezanoj za bilo koji period primjenom sljedeće relacije: ⎧100, t = b ⎪ ⎪ I (t +1) / 0 (4.26) It /0 = ⎨ ,t b U prethodnom izrazu b je bazni period i za t = b indeks je jednak 100. Bazne indekse za prethodne periode dobijamo dijeleći bazni indeks naredne sa lančanim indeksom te iste godine. Bazni indeksi za naredne periode dobiju se postupnim množenjem baznog indeksa iz prethodnog i lančanog indeksa iz posmatranog perioda. 4.2.3.2. Pretvaranje baznih u lančane indekse Pošto su indeksi na stalnoj bazi upravo proporcionalni orginalnim podacima, u postupku pretvaranja baznih u lančane indekse postupa se kao da se radi sa izvornim podacima. Indeksi na stalnoj bazi pretvaraju se u lančane tako da se indeks iz tekućeg perioda dijeli sa prethodnim indeksom i rezultat pomnoži sa 100.

I t /(t −1) =

It / 0 I (t −1) / 0

⋅ 100, t = 2,3,.., n.

(4.27)

Pri pretvaranju baznih u lančane indekse nije bitno koji period ćemo izabrati za bazno razdoblje. 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu Indeksi na stalnoj bazi preračunavaju se na drugu bazu tako da se svaki indeks podijeli indeksom novog baznog razdoblja i dobijeni odnos pomnoži sa 100.

I t*/ 0 =

182

It / 0 ⋅ 100 I b* / 0

(4.28)

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Dva najčešća razloga promjene baze indeksa su potreba poređenja različitih varijabli (DBP, nezaposlenost, itd.) čiji objavljeni indeksi su rijetko izraženi na osnovu iste baze i periodično usklađivanje baza kada je potrebno reaktualizirati bazu ako se serija previše udaljava od orginalne vrijednosti. U ovom slučaju koristi se osobina tranzitivnosti it / 0 = it /1 ⋅ i1/ 0 ⇒ it /1 =

it / 0 . i1/ 0

Novi indeks je jednak količniku između polaznog baznog indeksa i indeksa nove bazne godine izraženog u staroj bazi 0.

Primjer 4.10. Lančani indeksi industrijske proizvodnje Federacije BiH su predstavljeni u sljedećoj tabeli: Tabela 4.12. Lančani indeksi industrijske proizvodnje Federacije BiH

I96/95

I97/96

I98/97

I99/98

I00/99

I01/00

187,6

135,7

123,8

110,6

108,8

112,2

Izvor: Statistički godišnjak Federacije BiH, 2002, str.113.

Na ovom primjeru ćemo ilustrovati pretvaranje lančanih u bazne indekse uz pretpostavku da je baza 100 u 1998. godini. Tabela 4.12.a. Pretvaranje lančanih u bazne indekse 1995.

1996.

1997.

1998. 1999.

2000.

2001.

Postupak 59,5/1,876 80,8/1,357 100/1,238 100

110,6 110,6⋅1,088 120,3⋅1,122⋅

Indeksi

110,6

31,7

59,5

80,8

100

120,3

134,97≈135

4.2.4. Agregatni indeksi Najznačajniji agregatni indeksi su: indeks vrijednosti, indeks cijena, indeks fizičkog obima proizvodnje, indeksi troškova života, itd. Konstrukciju agregatnih indeksa ćemo ilustrovati na primjeru potrošnje dva proizvoda. 183

Statistika u ekonomiji i menadžmentu

Tabela 4.13. Cijena proizvoda A i B

2004. 2005.

Proizvod A Cijena KM/kom 4 6

Proizvod B Cijena KM/kom 10 11

Na osnovu datih podataka možemo izračunati samo individualne indekse cijena svakog proizvoda gdje je 2004. bazna godina.

IpA =

6 ⋅ 100 = 150 4

IpB =

11 ⋅ 100 = 110 10

Konstatujemo da se cijena proizvoda A povećala za 50%, a cijena proizvoda B za 10% u posmatranom periodu. Ako gornju tabelu kompletiramo sa podacima o kupljenim količinama svakog proizvoda: Tabela 4.14. Cijena i kupljena količina proizvoda A i B Proizvod A

2004. 2005.

Cijena KM/kom 4 6

Komad 10 12

Proizvod B

Cijena KM/kom 10 11

Komad 8 10

Možemo izračunati za svaku godinu budžet utrošen za kupovinu tih proizvoda: Budžet u 2004.:

4 KM / kom ⋅ 10kom + 10 KM / kom ⋅ 8kom = 40 KM + 80 KM = 120 KM Budžet u 2005.:

6 KM / kom ⋅ 12kom + 11KM / kom ⋅ 10kom = 72 KM + 110 KM = 182 KM 184

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

i izračunati sljedeći indeks vrijednosti:

IW 05 / 04 =

W05 182 = ⋅ 100 = 151, 67 W04 120

na osnovu kojeg konstatujemo da se budžet potrošača utrošen na kupovinu dva posmatrana proizvoda povećao za 51,67% u 2005. u odnosu na 2004. godinu. 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja Da bismo objasnili konstrukciju agregatnih indeksa cijena metodom agregiranja formalizaciju ćemo predstaviti na sljedeći način: Tabela 4.15. Konstrukcija agregatnih indeksa cijena

(i=0) (i=1)

Proizvod A (j)=1 Proizvod B (j)=2 Vrijednost potrošačke Cijena KM/kom Komad Cijena KM/kom Litar pi(1) pi(2) qi(2) korpe (W) qi(1) 2004. 4 10 10 8 120 2005. 6 12 11 10 182

U gornjoj tabeli smo uveli sljedeće simbole: p je cijena, q je količina, i je indeks datuma, a j indeks proizvoda, bazna godina je 2004. (i=0) i posmatrana godina 2005. (i=1). Potrošnja u 2004.: (i=0) 2

∑ p0 q0 = ∑ p0( j ) q0( j ) = p10 q10 + p02 q02 = 4 ⋅ 10 + 10 ⋅ 8 = 120 j =1

Potrošnja u 2005.: (i=1) 2

∑pq =∑p 1 1

j =1

( j) ( j) 1 1

q

= p11 q11 + p12 q12 = 6 ⋅ 12 + 11 ⋅ 10 = 182

Indeks vrijednosti ćemo označiti sa IW i izračunati na sljedeći način: 185

Statistika u ekonomiji i menadžmentu

IW 1/ 0 =

∑pq ∑p q

1 1

⋅ 100 =

0 0

182 ⋅ 100 = 151, 67 120

Indeks vrijednosti mjeri evoluciju cijena i kupljenih količina. Budžet utrošen za kupovinu ova dva proizvoda se povećao za 51,67%. Da bismo izračunali indeks cijena možemo fiksirati strukturu potrošnje u baznom ili u posmatranom periodu. •

Struktura potrošnje (količina) fiksirana u baznom periodu

Ako strukturu potrošnje fiksiramo u 2004. godini (bazni datum) dobijamo Laspeyres (Lasperov) indeks cijena:

L p1/ 0 =

∑pq ∑p q

1 0

⋅ 100 =

0 0

=

p11 q01 + p12 q02 ⋅ 100 = p10 q01 + p02 q02

6 ⋅ 10 + 11 ⋅ 8 148 ⋅ 100 = ⋅ 100 = 123,33 120 120

148 KM je fiktivna vrijednost koju bi imala potrošačka korpa u 2005. ako bi potrošnja ostala ista kao u 2004. Laspeyres indeks cijena u 2005. baza 100 u 2004. je jednak 123,33. Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,33% u posmatranom periodu. •

Struktura potrošnje (količina) fiksirana u posmatranom periodu

Ako strukturu potrošnje fiksiramo u posmatranom periodu, tj. u 2005. godini, dobijamo Paasche (Pašev) indeks cijena:

Pp1/ 0 =

∑pq ∑p q

1 1 0 1

=

⋅ 100 =

p11 q11 + p12 q12 ⋅ 100 = p01 q11 + p02 q12

6 ⋅ 12 + 11 ⋅ 10 182 ⋅ 100 = ⋅ 100 = 122,97 4 ⋅ 12 + 10 ⋅ 10 148

148 KM je fiktivna vrijednost koju bi imala potrošačka korpa ako bi u 2004.g. potrošnja bila jednaka potrošnji u 2005.g. Paasche indeks cijena potrošnje u 2005.g. baza 100 u 2004.g. je jednak 122,97. Na osnovu ovog indeksa konstatujemo povećanje cijena od 22,97%. 186

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Indeks izračunat na bazi ponderacija iz posmatranog perioda je najčešće manji od indeksa utvrđenog na osnovu ponderacija iz baznog perioda. 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina Laspeyres i Paasche indeks možemo formalizirati koristeći ponderisane sredine.



Laspeyres indeks možemo izraziti u obliku aritmetičke sredine na sljedeći način:

L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 ( j)

gdje α 0( j ) predstavlja realni budžetski koeficijent (ponder) proizvoda (j) utvrđen u baznom periodu 0. Dobijamo ga kao odnos realne potrošnje za svaki proizvod u baznom periodu i realne vrijednosti potrošačke korpe u baznom periodu. Za proizvod A (j=1):

α 0(1) =

p 01 ⋅ q01 4 ⋅ 10 = = 0,33 1 1 2 2 120 p0 ⋅ q0 + p0 ⋅ q0

Za proizvod B (j=2):

α 0( 2) =

p 02 ⋅ q 02 80 = = 0,67 1 1 2 2 p 0 ⋅ q 0 + p 0 ⋅ q 0 120

α 0(1) + α 0( 2) = 0,33 + 0,67 = 1 L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 = α 01 ⋅ I 1p1 / 0 + α 02 ⋅ I p21 / 0 ( j)

= 0,33 ⋅ I pA + 0,67 ⋅ I pB

= 0,33 ⋅ 150 + 0,67 ⋅ 110 = 123,2 Dobili smo isti rezultat kao sa agregatnim oblikom Laspeyres indeksa cijena. 187

Statistika u ekonomiji i menadžmentu



Paasche indeks u obliku aritmetičke sredine

j) Pp 05 / 04 = ∑ β 01( j ) ⋅ I p( 05 / 04 ( j)

β 01( j ) je fiktivni budžetski koeficijent proizvoda (j) računat na osnovu cijena iz baznog perioda i količina iz posmatranog perioda. Dobijamo ga kao odnos fiktivne potrošnje svakog proizvoda i fiktivne vrijednosti potrošačke korpe. Za proizvod A (j=1):

β

1 p = 0 , q =1

p01 ⋅ q11 48 = 1 1 = = 0,32 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148

β p2=0,q =1 =

p 02 ⋅ q12 100 = = 0,68 1 1 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148

Pp 05 / 04 = β 1p =0,q =1 ⋅ I 1p + β p2=0,q =1 ⋅ I p2 = 0,32 ⋅ 150 + 0,68 ⋅ 110 = 122,8 Dobili smo naravno isti rezultat kao sa agregatnim oblikom Paasche indeksa cijena. Na osnovu izračunatih indeksa možemo posmatrati evoluciju strukture potrošnje. Realne proporcije u 2004.g. su sljedeće: 33% budžeta je utrošeno za proizvod A (indeks cijena: 150) i 67% budžeta je utrošeno za proizvod B (indeks cijena: 110). Realne proporcije u 2005.g. su: 40% budžeta je utrošeno za proizvod A i 60% budžeta je utrošeno za proizvod B. 4.2.4.3. Formule za računanje i osobine agregatnih indeksa



Formule za agregatne indekse dobijene metodom agregiranja su sljedeće: -

Agregatni indeksi cijena

1. Laspeyres:

L p1/ 0 = 100 ⋅

∑pq ∑p q

1 0 0 0

količina je fiksirana u baznom periodu. 188

(4.29)

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

2. Paasche:

Pp1/ 0 = 100 ⋅

∑pq ∑pq

1 1

(4.30)

0 1

količina je fiksirana u posmatranom periodu.

-

Agregatni indeksi količina

1. Laspeyres:

Lq1/ 0 = 100 ⋅

∑p q ∑p q

0 1

(4.31)

0 0

cijene su fiksirane u baznom periodu. 2. Paasche:

Pq1/ 0 = 100 ⋅

∑pq ∑pq

1 1

(4.32)

1 0

cijene su fiksirane u posmatranom periodu.



Formule dobijene na osnovu ponderisanih sredina -

Agregatni indeks cijena

1. Laspeyres:

L p1/ 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0

(4.33)

( j)

Laspeyres indeks cijena je jednak aritmetičkoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu baznog perioda. 2. Paasche:

Pp1/ 0 =

1

∑α ( j)

( j) 1



1

(4.34)

I p( 1j )/ 0 189

Statistika u ekonomiji i menadžmentu

Paasche indeks cijena je jednak harmonijskoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu posmatranog perioda.



Agregatni indeksi količina

Agregatne indekse količina definišemo sljedećim izrazima: 1. Laspeyres: Lq1/ 0 = ∑ α 0( j ) ⋅ I q(1j/)0

(4.35)

( j)

2. Paasche:

Pq1/ 0 =

1

∑α

( j) 1

( j)





1

(4.36)

I q(1j/)0

Osobine agregatnih indeksa

Laspeyres indeksi koji se izračunavaju kao ponderisana aritmetička sredina imaju osobinu agregiranja. Teorijski ni indeksi Laspeyres, ni indeksi Paasche nemaju osobinu tranzitivnosti. U praksi se, zbog činjenice da je ova osobina numerički skoro zadovoljena, pretpostavlja da i ovi indeksi zadovoljavaju osobinu tranzitivnosti da bi se pojednostavila njihova primjena.

Primjer 4.11. Indeks troškova života 2000./1999. u Federaciji BiH je jednak:

itž 00/99 = 1,014 Indeks troškova života 2001./2000. u Federaciji BiH je jednak:

itž 01/00 = 1,021 Konstatujemo da je: itž 01/99 = 1,014 ⋅1,021 = 1,035 Dakle, stopa inflacije u periodu od dvije godine je jednaka 3,5% U statističkoj praksi se za određivanje indeksa cijena koristi najčešće Laspeyres indeks. Federalni zavod za statistiku BiH i Agencija za statistiku BiH koriste Laspeyres indeks za utvrđivanje cijena. 190

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

4.2.4.4. Fischerov indeks cijena Fischerov indeks cijena je jednak geometrijskoj sredini Laspeyres i Paasche indeksa cijena:

F p 1 / 0 = L p 1 / 0 ⋅ Pp 1 / 0

(4.37)

Ako uvrstimo Laspeyres i Paasche indeks cijena iz našeg primjera, dobijamo Ficherov indeks cijena.

F p 03 / 02 = 123,33 ⋅ 122,97 = 123,15 Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,15% 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija Agregatni indeks vrijednosti je definisan sljedećim izrazom:

IW1 / 0 =

∑pq ∑p q

1 1

⋅ 100

(4.38)

0 0

Agregatni indeks vrijednosti možemo dekomponovati na sljedeći način:

iW1 / 0 =

∑pq ∑p q

1 1

=

0 0

∑pq

1 1

X



X = ∑ p0 q0

∑pq ⋅∑p q ∑p q ∑p q

Y = ∑ p0 q0

∑pq ⋅∑pq ∑pq ∑p q

1 1

0 1

0 1

0 0

iW1 / 0 = pp.lq(4.39) iW1 / 0 =

∑pq ∑p q

1 1

=

0 0

iW1 / 0 = pq .lp

∑pq

1 1

Y



1 1

1 0

1 0

0 0

(4.40)

Primjena na našem primjeru:

lq1/ 0 =

∑p q ∑p q

0 1

0

0

=

4 ⋅ 12 + 10 ⋅ 10 148 = = 1,233 120 120

191

Statistika u ekonomiji i menadžmentu

pq1/ 0 =

∑pq ∑pq

1 1

1 0

=

182 59 = = 1,230 6 ⋅ 10 + 11 ⋅ 8 50

iW = l p ⋅ pq = 1, 233 ⋅ 1, 230 = 1,52 Povećanje od 52 % vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23,3% i povećanja kupljene količine za 23%.

iW = p p ⋅ lq = 1, 23 ⋅ 1, 233 = 1,52 Povećanje od 52% vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23% i povećanja kupljene količine za 23,3%. 4.2.4.6. Inflacija i deflator Inflacija je ekonomska neravnoteža koja se manifestuje konstantnim povećanjem cijena. Porast cijena, koji je simptom inflacije, se mjeri pomoću indeksa troškova života koji računaju i objavljuju zvanične statističke institucije. Indeks troškova života za 2001./2000. u Federaciji BiH je bio jednak itž 01/00 = 1,021 . To znači da je stopa rasta troškova života u periodu 2000.-2001. bila 2,1%. Deflator je statistički indikator pomoću kojeg eliminišemo uticaj inflacije koja vještački povećava vrijednost proizvoda i usluga. Deflator nam omogućava da veličine izražene u tekućim cijenama izrazimo u stalnim cijenama. Na sljedećem primjeru ćemo ilustrovati primjenu deflatora. Tabela 4.16. Prosječne godišnje neto plate u Federaciji BiH

Prosječne godišnje neto plate u KM Indeksi troškova života

1997.

1998.

1999.

2000.

2001.

266,33

329,12

374,54

412,72

443,26

106,8

99,3

101,4

102,1

Izvor: Statistički godišnjak Federacije BiH 2001, str. 267., Statistički godišnjak Federacije BiH 2002, str. 271.

192

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Izračunaćemo nominalni i realni indeks plata za period 1997.-1998. i 2000.2001. godina. • U analizi plata kao deflator koristimo indeks troškova života. Prvo ćemo izračunati nominalni indeks plata za 98./97. In plata 98/97=329,12/266,33=123,6.



Prema ovom indeksu, plate su se u periodu 97.-98. povećale za 23,6%. Da bismo izračunali realni indeks plata, nominalne indekse plata smo deflacionirali indeksom troškova života. Realni indeks plata 98./97. je jednak: Ir plata 98/97= In / Itž =123,6/106,8=115,7. Prema ovom indeksu plata, za isti period, konstatujemo da su se plate povećale za 15,7%.

Kao deflator se može koristiti i indeks cijena na malo koji računaju i objavljuju zvanične statističke institucije. U opštem slučaju da bismo pokazatelje izražene u tekućim izrazili u stalnim cijenama koristimo odgovarajući deflator. Da bismo dobili stalne cijene, tekuće cijene je potrebno podijeliti sa deflatorom isc=itc /deflator. U slučaju plata u našem primjeru koristili smo kao deflator indeks troškova života isc=itc/itž. Da bismo izrazili realne indekse plata bilo je potrebno podijeliti nominalne indekse plata sa indeksima troškova života ir=in/itž.

4.3. VREMENSKE (HRONOLOŠKE) SERIJE Polaznu osnovu za analizu pojava u vremenu čini vremenska serija. Vremenska serija je skup hronološki utvrđenih vrijednosti neke pojave. Zadaci analize vremenskih serija su: • Opis razvoja pojave u vremenu • Objašnjenje varijacije pojave u vremenu • Predviđanje razvoja pojave.

193

Statistika u ekonomiji i menadžmentu

4.3.1. Konstitutivni elementi vremenske serije Konstitutivni elementi vremenske serije su: dugoročna tendencija ili trend, ciklične varijacije, sezonske promjene i slučajne ili rezidualne promjene.



Tendencija ili trend

Trend izražava dugoročnu evoluciju ili osnovni tok kretanja pojave i izražava se funkcijama vremena. Trend predstavlja dugoročnu generalnu tendenciju rasta ili opadanja pojave koja se istražuje. U ekonomiji dugoročna tendencija ima trajanje duže od 10 godina. Ova dugoročna tendencija potiče iz fenomena čiji se efekti manifestuju poslije dugo vremena (rađanje/struktura populacije prema godinama starosti, tehničke promjene/efikasnost osnovnih sredstava itd.). Primjer dugoročne tendencije rasta pokazuje cijene troškova života.



Ciklične varijacije

Ciklične varijacije mogu biti različitog intenziteta i trajanja. Njihova periodičnost je od 2 do 10 godina. Uzrok ovih varijacija su uglavnom fluktuacije u tokovima (potrošnja, investicije itd.). Cikličnu komponentu koja predstavlja dugoročne varijacije oko trenda je često teško identifikovati tako da se može smatrati kao dio trenda.



Sezonske varijacije

Sezonske varijacije pokazuju sezonski ili periodični uticaj na analiziranu pojavu. Sezonske promjene karakterišu oscilacije regularnog trajanja i intenziteta oko trenda. Periodičnost pojavljivanja sezonskih varijacija je manja ili jednaka godini. Sezonske varijacije se mogu lahko uočiti ukoliko kretanje pojave predstavimo grafički. Tipični primjeri ovog tipa varijacija su: potrošnja električne energije, proizvodnja poljoprivrednih proizvoda, broj noćenja u turizmu, dolazak novih osoba na tržište rada itd.



Slučajne ili rezidualne promjene

Slučajne promjene ne možemo objasniti sa tri prethodno analizirane grupe promjena. Slučajne promjene su nepredvidljive i neregularne. Primjer: ratovi, štrajkovi, poplave, požari i druge netipične promjene. 194

Poglavlje 4. – Dinamička analiza i mjerenje evolucije

Trend komponenta, ciklične i sezonske promjene se nazivaju sistematskim, determinističkim komponentama jer predstavljaju kovarijacije pojave koje se mogu izraziti funkcijom vremena. Slučajna komponenta je nesistematska. Ona ukazuje na postojanje neregularnih promjena. Vremenska serija ne mora uvijek sadržavati sve navedene komponente. Osnovni zadatak u analizi vremenskih serija je identificiranje, izolovanje i eliminisanje uticaja cikličnih, sezonskih i slučajnih promjena da bi se mogla odrediti dugoročna tendencija posmatrane pojave. Za određivanje dugoročnih tendencija (trenda) promjene pojava predstavljenih vremenskim serijama najčešće koristimo empirijski metod pokretnih sredina i analitički metod najmanjih kvadrata. 4.3.2. Metod pokretnih sredina za određivanje trenda Pokretne sredine reda p (p
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF