Statistika u ekonomiji i menadžmentu
October 6, 2017 | Author: shya456 | Category: N/A
Short Description
Download Statistika u ekonomiji i menadžmentu...
Description
Naziv djela: Statistika u ekonomiji i menadžmentu Drugo izdanje Autor: Prof. dr Rabija Somun-Kapetanović Izdavač: Ekonomski fakultet u Sarajevu Glavni i odgovorni urednik: Dekan, prof. dr Muris Čičić Recenzenti: Prof. dr Divna Janković Prof. dr Želimir Vučković Urednik: Prof. dr Hasan Muratović Lektor: Dr Aiša Softić DTP: Engin Mešanović Štampa: VMG Grafika, Mostar Tiraž: 300 Godina izdanja: 2008. ---------------------------------------------------------------------------CIP – Katalogizacija u publikaciji Nacionalna i univerzitetska biblioteka Bosne i Hercegovine, Sarajevo 330. 45: 512. 2] (075. 8) SOMUN-Kapetanović, Rabija Statistika u ekonomiji i menadžmentu / Rabija Somun-Kapetanović. – 2. izd. – Sarajevo : Ekonomski fakultet, 2008. – 424 str. : graf. prikazi ; 24 cm Bibliografija: str. 423-424 ISBN 978-9958-25-008-8 I. Kapetanović, Rabija Somun – vidi Somun-Kapetanović, Rabija COBISS.BH-ID 16445958 ------------------------------------------------------------------------
Dr Rabija Somun-Kapetanović
STATISTIKA U EKONOMIJI I MENADŽMENTU DRUGO IZDANJE
Sarajevo, 2008. godine
PREDGOVOR PRVOM IZDANJU Postoji više pristupa prezentaciji statističke metodologije. Dva ekstremna slučaja su prezentacije kompletno matematizirane i apstraktne i prezentacije potpuno deskriptivne, bez provjere i izvođenja dokaza. Pristup koji smo mi primijenili u prezentaciji nalazi se između ova dva ekstremna slučaja i ima dva osnovna cilja. To su prezentacija i aplikacija analiziranih metoda i razumijevanje i interpretacija dobijenih rezultata. Ova knjiga je namijenjena prvenstveno studentima ekonomije, menadžmenta i ostalih društvenih nauka. Iako su bazni koncepti statistike univerzalni, naš pristup je baziran na analizi, prezentaciji i aplikaciji osnovnih koncepata u domenu ekonomije i menadžmenta. Osnovne definicije, osobine i rezultati su izvedeni i dokazani u mjeri u kojoj smo to smatrali korisnim za razumijevanje i aplikaciju prezentirane problematike. Sadržaj ovog izdanja knjige je rezultat dugogodišnjeg autorovog iskustva u nastavi iz oblasti Kvantitativne ekonomije i predmeta: Matematičke metode u ekonomiji, Međusektorska analiza, Operaciona istraživanja, Statistika, Eksperimentalna statistika, Statistika u ekonomiji i menadžmentu, Poslovna statistika, Kvantitativne metode i Demografija na Ekonomskom fakultetu u Sarajevu, Fakultetu ekonomskih nauka i upravljanja Univeziteta Louis Pasteur u Strasbourg-u (Faculté des sciences économiques et de gestion de l’Université Louis Pasteur de Strasbourg) i Instituta za demografiju Univerziteta Marc Bloch u Strasbourg-u (Institut de démographie de l’Université Marc Bloch de Strasbourg). Ova knjiga je koncipirana prema nastavnom programu predmeta Statistika u ekonomiji i menadžmentu koji se izučava na prvoj godini Ekonomskog fakulteta u Sarajevu. Sastavljena je iz šest poglavlja sa sljedećim naslovima: Statistika i statistička istraživanja, Analiza i sinteza podataka, Regresiona i korelaciona analiza, Dinamička analiza i mjerenje evolucije, Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće te Teorija i metode uzoraka i statističko zaključivanje. U svakom poglavlju su definisani, analizirani i formalizirani osnovni pojmovi i kategorije koji su zatim aplicirani na konkretnim primjerima. Aplikacija analiziranih metoda je vršena na statističkim podacima objavljenim u publikacijama Federalnog zavoda za statistiku Bosne i Hercegovine, Agencije za statistiku Bosne i Hercegovine i Nacionalnog instituta za statistiku i ekonomske studije (INSEE) Francuske. Na kraju svakog poglavlja su prezentovani lista
5
teorijskih pitanja, riješeni zadaci i zadaci sa elementima rješenja. U prilogu su date tablice teorijskih distribucija vjerovatnoće. Posebnu zahvalnost izražavam recenzentima prof. dr Divni Janković i prof. dr Želimiru Vučkoviću čije su primjedbe i prijedlozi doprinijeli poboljšanju teksta. Autor je odgovoran za eventualne greške i propuste. Zahvaljujem i mojim saradnicama posebno mr Emini Resić, koja je pažljivo pročitala tekst, pripremila tablice u prilogu, i u svim fazama izrade ovog udžbenika mi pružila veliku pomoć, kao i Adeli Delalić i Almiri ArnautBerilo. Svim ostalim koji su doprinijeli da ova knjiga bude napisana i objavljena iskreno zahvaljujem. Knjigu posvećujem mojoj majci za 99. rođendan i za njenu beskrajnu ljubav, plemenitost i dobrotu. Nadam se da će ova knjiga zadovoljiti potrebe studenata i svih onih koji koriste statističke metode u svom radu. Unaprijed zahvaljujem za sve primjedbe, sugestije i konstruktivne kritike koje bi mogle poboljšati prezentovani tekst. Sarajevo, aprila 2006.g. Prof. dr Rabija Somun-Kapetanović
PREDGOVOR DRUGOM IZDANJU Zadovoljstvo mi je prezentovati drugo izdanje knjige „Statistika u ekonomiji i menadžmentu“. U ovom izdanju su izvršene određene izmjene, dopune i korekcije teksta prvog izdanja. Zahvaljujem mojim saradnicima mr Emini Resić, Adeli Delalić i Ademiru Abdiću koji su svojim sugestijama doprinijeli poboljšanju teksta za drugo izdanje ove knjige. Sarajevo, marta 2008. godine Prof. dr Rabija Somun-Kapetanović
6
SADRŽAJ POGLAVLJE 1. STATISTIKA I STATISTIČKA ISTRAŽIVANJA
15
1.1.
15
POJAM STATISTIKE
1.2. NAUČNI PRISTUP STATISTIČKOM ISTRAŽIVANJU 1.2.1. Prikupljanje podataka 1.2.1.1. Metode prikupljanja podataka 1.2.2. Obrada podataka
17 17 17 19
1.3. STATISTIČKI SKUP I STATISTIČKE VARIJABLE 1.3.1. Statistički skup i njegove karakteristike 1.3.2. Pojam, proces mjerenja i karakteristike statističke varijable 1.3.2.1. Nominalna skala 1.3.2.2. Ordinalna skala 1.3.2.3. Intervalna skala 1.3.2.4. Metrička skala 1.3.3. Primjer projekta istraživanja 1.3.4. Statistički pojmovi i definicije 1.3.5. Prezentacija statističkih podataka 1.3.5.1. Tabelarna prezentacija 1.3.5.2. Grafička prezentacija
19 19 20 21 21 22 22 22 23 25 28 31
POGLAVLJE 2. ANALIZA I SINTEZA PODATAKA
39
2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 2.1.1. Definicije 2.1.2. Formalizacija definicija
39 39 40
2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI 2.2.1. Kvalitativne varijable 2.2.1.1. Kvalitativna nominalna varijabla 2.2.1.2. Kvalitativna ordinalna varijabla 2.2.2. Kvantitativne varijable 2.2.2.1. Kvantitativna prekidna varijabla 2.2.2.2. Kvantitativna neprekidna varijabla
44 44 44 45 45 45 45
2.3.
45
GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE
7
2.4. 2.4.1.
2.4.2. 2.4.3. 2.4.4. 2.4.5. 2.4.6.
2.4.7.
MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Aritmetička sredina 2.4.1.1. Jednostavna aritmetička sredina 2.4.1.2. Ponderisana aritmetička sredina 2.4.1.3. Osobine aritmetičke sredine Geometrijska sredina Harmonijska sredina Kvadratna i kubna sredina Mod ili centar aktivnosti Medijana ili centar pozicije 2.4.6.1. Određivanje medijane u uređenoj seriji 2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija 2.4.6.3. Medijana i kumulativna frekvencija 2.4.6.4. Karakteristike medijane Kvantili 2.4.7.1. Određivanje kvantila u uređenoj seriji 2.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji 2.4.7.3. Kvartili 2.4.7.4. Decili 2.4.6.5. Centili
47 48 48 49 50 53 54 55 56 58 58 59 60 62 62 62 63 63 65 65
2.5. MJERE DISPERZIJE ILI VARIJACIJE 2.5.1. Apsolutne mjere disperzije 2.5.1.1. Raspon varijacije 2.5.1.2. Interkvantilno apsolutno odstupanje 2.5.1.3. Box Plot 2.5.1.4. Srednje apsolutno odstupanje 2.5.1.5. Varijansa 2.5.1.6. Standardna devijacija 2.5.2. Relativne mjere disperzije 2.5.2.1. Interkvantilna relativna odstupanja 2.5.2.2. Koeficijent kvartilne devijacije 2.5.2.3. Koeficijent varijacije 2.5.2.4. Standardizovane varijable 2.5.3. Čebiševa teorema 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije 2.5.5. Pregled mjera srednje vrijednosti i varijacije
66 67 67 67 67 69 71 74 75 75 76 76 76 77 78 79
2.6. 2.6.1. 2.6.2. 2.6.3.
80 80 81 84
8
MJERE OBLIKA DISTRIBUCIJE Momenti distribucije frekvencija Mjere asimetrije Parametri spljoštenosti
2.7. MJERE KONCENTRACIJE 2.7.1. Lorenzova kriva 2.7.2. Ginijev koeficijent 2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova 2.7.3. Medijala
87 87 91 92 93 95
2.8. 2.9.
96 98
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
POGLAVLJE 3. REGRESIONA I KORELACIONA ANALIZA
111
3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI 3.1.1. Etape konstrukcije modela 3.1.1.1. Dijagram (oblak) rasipanja
111 112 112
3.2.
KOVARIJANSA
113
3.3. 3.3.1. 3.3.2. 3.3.3.
REGRESIONA ANALIZA Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavke o osobinama stohastičnosti modela Aplikacija analiziranih metoda
116 117 120 121
3.4.
MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Koeficijent determinacije Koeficijent korelacije Standardna greška regresionog modela Koeficijent varijacije regresionog modela Aplikacija različitih oblika regresionog modela 3.4.5.1. Linearni model 3.4.5.2. Eksponencijalni model 3.4.5.3. Stepeni model 3.4.5.4. Logaritamski model Spearmanov koeficijent korelacije ranga
126 126 128 129 130 130 131 134 135 135 140
3.4.1. 3.4.2. 3.4.3. 3.4.4. 3.4.5.
3.4.6.
3.5. MODEL VIŠESTRUKE REGRESIJE 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica 3.5.2. Analiza numeričkog primjera
141 142
3.6. 3.7.
145 146
TEORIJSKA PITANJA RIJEŠENI ZADACI
140
9
POGLAVLJE 4. DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE
153
4.1.
153
APSOLUTNA I RELATIVNA PROMJENA
4.2. INDEKSI 4.2.1. Individualni indeksi 4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) 2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) 4.2.2. Osobine indeksa 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne 4.2.3.2. Pretvaranje baznih u lančane indekse 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu 4.2.4. Agregatni indeksi 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina 4.2.4.3. Formule za računanje i osobine agregatnih indeksa 4.2.4.4. Fischerov indeks cijena 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija 4.2.4.6. Inflacija i deflator
160 161 162
4.3. VREMENSKE (HRONOLOŠKE) SERIJE 4.3.1. Konstitutivni elementi vremenske serije 4.3.2. Metod pokretnih sredina za određivanje trenda 4.3.2.1. Određivanje tendencije metodom pokretnih sredina neparnog reda 4.3.2.2. Određivanje tendencije metodom pokretnih sredina parnog reda 4.3.3. Aditivni model 4.3.4. Multiplikativni model 4.3.5. Metod najmanjih kvadrata za određivanje dugoročne tendencije (trenda) 4.3.5.1. Linearni trend 4.3.5.2. Parabolični trend 4.3.5.3. Eksponencijalni trend
193 194 195
4.4. 4.5.
209 210
10
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
164 171 181 181 182 182 183 185 187 188 191 191 192
196 198 202 202 203 204 207 208
POGLAVLJE 5. OSNOVI VJEROVATNOĆE I TEORIJSKE DISTRIBUCIJE VJEROVATNOĆE 5.1. Uloga i značaj eksperimenta u statistici 5.1.1. Slučajni eksperiment, skup mogućih rezultata eksperimenta i događaji 5.1.1.1. Vrste događaja 5.1.1.2. Osobine skupova 5.2. 5.2.1. 5.2.2. 5.2.3.
5.2.4.
5.2.5. 5.2.6. 5.2.7.
5.2.8.
DEFINISANJE VJEROVATNOĆE Eksperimentalni pristup definisanju vjerovatnoće Teorijska definicija vjerovatnoće Teoreme vjerovatnoće 5.2.3.1. Teorema aditivnosti 5.2.3.2. Teorema multiplikativnosti 5.2.3.3. Uslovna vjerovatnoća i nezavisnost slučajnih događaja 5.2.3.4. Bayesova teorema Kombinatorika 5.2.4.1. Permutacije 5.2.4.2. Kombinacije 5.2.4.3. Varijacije Slučajna ili stohastička varijabla 5.2.5.1. Prekidna slučajna varijabla 5.2.5.2. Neprekidna slučajna varijabla Čebiševa teorema Prekidne distribucije (zakoni, rasporedi) vjerovatnoće 5.2.7.1. Uniformni zakon vjerovatnoće 5.2.7.2. Bernoullijeva distribucija vjerovatnoće 5.2.7.3. Binomna distribucija vjerovatnoće 5.2.7.4. Poissonova distribucija vjerovatnoće 5.2.7.5. Hipergeometrijska distribucija vjerovatnoće 5.2.7.6. Tabelarni pregled prekidnih distribucija Neprekidne distribucije vjerovatnoće 5.2.8.1. Neprekidna uniformna distribucija 5.2.8.2. Normalna distribucija vjerovatnoće ili Laplace-Gaussova distribucija 5.2.8.3. Aproksimacije distribucija vjerovatnoće 5.2.8.4. Hi-kvadrat χ 2 distribucija 5.2.8.5. Studentova t distribucija 5.2.8.6. Ficher-Snedecorova (F) distribucija 5.2.8.7. Tabelarni pregled neprekidnih distribucija vjerovatnoće 5.2.8.8. Centralna granična teorema
( )
229 229 230 232 235 235 236 237 239 239 240 240 241 244 244 244 245 245 246 250 252 253 253 255 257 261 266 266 267 267 269 279 283 285 288 290 290
11
5.3. 5.4.
5.2.8.9. Šematski prikaz prekidnih i neprekidnih distribucija vjerovatnoće
291
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
292 293
POGLAVLJE 6. TEORIJA I METODA UZORAKA I STATISTIČKO ZAKLJUČIVANJE
305
6.1. OSNOVE TEORIJE UZORAKA 6.2. VRSTE UZORKA I METODE ZA IZBOR UZORKA 6.2.1. Slučajni uzorci 6.2.1.1. Jednostavni slučajni uzorak 6.2.1.2. Sistematski uzorak 6.2.1.3. Uzorak sa nejednakom vjerovatnoćom izbora jedinica 6.2.1.4. Stratifikovani uzorak 6.2.1.5. Uzorak skupina 6.2.1.6. Višestepeni uzorak 6.2.1.7. Višefazni uzorci 6.2.1.8. Panel uzorak 6.2.1.9. Namjerni uzorci
306 311 311 312 315 316 317 317 318 319 320 320
6.3.
PROCJENE OBILJEŽJA OSNOVNOG SKUPA NA OSNOVU UZORKA
6.4. ODREĐIVANJE INTERVALA POVJERENJA 6.4.1. Intervalna procjena aritmetičke sredine osnovnog skupa 6.4.1.1. Intervalna procjena aritmetičke sredine osnovnog skupa čija je varijansa poznata 6.4.1.2. Procjena intervala aritmetičke sredine osnovnog skupa čija je varijansa nepoznata 6.4.1.3. Interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata 6.4.2. Procjena intervala povjerenja za proporciju 6.4.3. Intervalna procjena standardne devijacije i varijanse osnovnog skupa 6.4.3.1. Intervalna procjena standardne devijacije 6.4.3.2. Intervalna procjena varijanse osnovnog skupa pomoću hi-kvadrat distribucije na osnovu poznate varijanse malog uzorka 6.4.3.3. Interval povjerenja za varijansu velikog uzorka 6.4.4. Interval povjerenja totala osnovnog skupa 6.4.5. Interval povjerenja za medijanu
12
321 327 327 327 331 332 334 336 336 337 337 338 338
6.4.6. Ocjena intervala za parametre modela linearne regresije 6.4.7. Intervalna procjena koeficijenta korelacije
339 340
6.5. TESTIRANJE HIPOTEZA 6.5.1. Formulisanje hipoteza 6.5.1.1. Donošenje odluke i greške tipa I i II 6.5.1.2. Empirijski nivo značajnosti p-vrijednost 6.5.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa 6.5.2.1. Varijansa osnovnog skupa poznata 6.5.2.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n ≥30 6.5.2.3. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n, =, xmax (2.4)
S ( xi ) ≤ S ( x j ),
xi < x j
j-ti član kumulativne rastuće distribucije relativnih frekvencija izražavamo u sljedećem obliku: j
F ( x j ) = ∑ pi , j = 1, 2,..., k , i =1
F ( x j ) = p( X ≤ x j )
(2.5)
Osobine rastuće kumulativne distribucije sa relativnim frekvencijama su:
⎧0 , ⎪ F ( x j ) = ⎨0 ≤ F ( x j ) ≤ 1, ⎪ , ⎩1
x j < xmin xmin ≤ x j ≤ xmax x j > xmax (2.6)
F ( xi ) ≤ F ( x j ),
xi < x j
Objašnjenje vrijednosti kumulativne distribucije frekvencija proizilazi iz načina njenog formiranja. S(xj) predstavlja broj modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj. Analognim postupkom kompletiramo izraz za kumulativnu distribuciju relativnih frekvencija. Kumulativna distribucija relativnih frekvencija F(xj) pokazuje proporciju modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj.
41
Statistika u ekonomiji i menadžmentu
Prema definiciji, zbir kumulativne rastuće relativne frekvencije jednog modaliteta i kumulativne opadajuće relativne frekvencije istog modaliteta je jednak jedinici (ili 100%). Ako je data distribucija frekvencija sa intervalima S(xj) predstavlja broj modaliteta sa vrijednošću varijable koja je jednaka ili manja od gornje granice j-tog intervala, a F(xj) proporciju modaliteta čija je vrijednost jednaka ili manja od gornje granice j-tog intervala. Na sljedećem primjeru ćemo kompletirati kumulativnu rastuću relativnu frekvenciju i objasniti njeno značenje. Primjer 2.1. Tabela 2.1. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004.g. Broj soba 1 2 3 4 5 Ukupno
Frekvencija fj 184 238 115 35 2 574
Relativna frekvencija pj 0,321 0,415 0,200 0,061 0,003 1
Kumulativna rastuća relativna frekvencija Fj 0,321 0,736 0,936 0,997 1 -
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.
U našem primjeru kumulativna frekvencija za broj soba manje ili jednako tri je jednaka 93,6%. Dakle, F(3)=93,6%, što znači da 93,6% završenih stanova u Federaciji Bosne i Hercegovine u 2004. g. ima 1, 2, ili 3 sobe. Na primjeru sljedeće distribucije frekvencija ćemo ilustrovati izračunavanje kumulativnih frekvencija i njihov grafički prikaz.
42
Poglavlje 2. – Analiza i sinteza podataka
Primjer 2.2. Tabela 2.2. Statistička distribucija frekvencija ocjena na ispitu iz predmeta Statistika Ocjena xj 6 7 8 9 10 Ukupno
fj 4 8 7 6 9 34
Sj + 4 12 19 25 34
Sj 30 22 15 9 0
pj 0,118 0,235 0,206 0,176 0,265 1,000
Fj+ 0,118 0,353 0,559 0,735 1
Fj 0,882 0,647 0,441 0,264 0,000
U tabeli Sj+ i Sj predstavljaju rastuće i opadajuće apsolutne kumulativne frekvencije, a Fj+ i Fj rastuće i opadajuće relativne kumulativne frekvencije.
Apsolutne frekvencije
35
Sj+
Sj-
30 25 20 15 10 5 0 6
Grafikon 2.1.
7
Ocjene
8
9
10
Kumulativne rastuce i opadajuce apsolutne frekvencije
43
Statistika u ekonomiji i menadžmentu
relativne frekvencije
1
Fj+
Fj -
0.8 0.6 0.4 0.2 0
6
Grafikon 2.2.
7
8
9
10 ocjene
Kumulativne rastuce i opadajuce relativne frekvencije
2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI Mi smo već u uvodnom dijelu naglasili da je osnovna dihotomija statističkih varijabli na kvalitativne i kvantitativne varijable. Modaliteti jedne varijable određuju njen tip. 2.2.1. Kvalitativne varijable Varijabla je kvalitativna ako se njeni modaliteti ne mogu kvantitativno izraziti. Modaliteti ove varijable su deskriptivno izraženi kao atributivna ili geografska obilježja. Naprimjer pol, bračno stanje, zaposleni prema stepenu stručnog obrazovanja, tip stana su kvalitativne varijable. Postoje dvije grupe kvalitativnih varijabli. To su kvalitativna nominalna i kvalitativna ordinalna varijabla. 2.2.1.1. Kvalitativna nominalna varijabla Varijabla je kvalitativna nominalna ako su njeni modaliteti dati u obliku atributivnih ili geografskih obilježja koje nije moguće klasirati prema nekom redosljedu (rangu) koji ima smisla. Naprimjer, varijabla «pol» čija dva modaliteta su: žena i muškarac. Kvalitativne varijable se mogu kodirati. Numeričko kodiranje npr. 1 za «ženu» i 2 za «muškarca» je arbitrarno i nikakve matematičke operacije sa kodiranim vrijednostima nisu dozvoljene. 44
Poglavlje 2. – Analiza i sinteza podataka
2.2.1.2. Kvalitativna ordinalna varijabla Varijabla je kvalitativna ordinalna ako je moguće klasirati njene modalitete prema nekom redosljedu koji ima smisla. Naprimjer, varijabla ocjena izražena sljedećim modalitetima: odličan, vrlodobar, dobar, dovoljan i nedovoljan. 2.2.2. Kvantitativne varijable Varijabla je kvantitativna ako su njeni modaliteti mogu kvantificirati i ako su brojčano izraženi. Primjeri ovog tipa varijable su: broj studenata na univerzitetu, broj soba u studentskom domu, težina studenata prve godine Ekonomskog fakulteta u Sarajevu, plata u KM, broj članova porodice itd. Kvantitativne varijable se dijele na prekidne (diskretne) i neprekidne (kontinuirane). 2.2.2.1. Kvantitativna prekidna varijabla Varijabla koja može poprimiti konačan broj izolovanih, odnosno diskretno raspoređenih vrijednosti se naziva se naziva kvantitativna (numerička) prekidna varijabla. Varijabla je kvantitativna prekidna ako su njeni modaliteti prebrojivi i najčešće cjelobrojni. Prebrojavamo npr. broj studenata u amfiteatru ili broj zaposlenih na fakultetu itd. 2.2.2.2. Kvantitativna neprekidna varijabla Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta neprebrojive. Ova varijabla može uzimati bilo koju vrijednost iz intervala koji pripada skupu realnih brojeva. Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta dobijene na osnovu mjerenja. Npr.: mjerimo visinu studenata. U praksi je jednostavno odrediti da li je jedna varijabla kvalitativna nominalna ili ordinalna. Ponekad je teško odrediti da li je jedna kvantitativna varijabla prekidna ili neprekidna.
2.3. GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE Grafička prezentacija koja se najčešće koristi u slučaju prekidne varijable je dijagram sa stupcima. Najznačajnija grafička prezentacija kontinuirane varijable je histogram. U slučaju serije intervalno grupisanih podataka sa 45
Statistika u ekonomiji i menadžmentu
jednakom amplitudom intervala, visina pravougaonika koji čine histogram je proporcionalna frekvenciji svakog intervala. Za seriju intervalno grupisanih podataka sa različitom amplitudom svakog intervala potrebno je izračunati frekvencije po jedinici amplitude koje nazivamo korigovane frekvencije i u tom slučaju površina svakog pravougaonika je proporcionalna frekvenciji intervala. Na prva dva grafikona ilustrujemo grafičko predstavljanje kvantitativne prekidne varijable. Ovu varijablu predstavljamo dijagramom sa stupcima na grafikonu 2.3. i njenu kumulativnu krivu na grafikonu 2.4.
x Grafikon 2.3.
Dijagram sa stupcima
1
x Grafikon 2.4.
46
Kumulativna kriva prekidne varijable
Poglavlje 2. – Analiza i sinteza podataka
Kvantitativnu neprekidnu varijablu predstavljamo histogramom i kumulativnom krivom. Histogram je predstavljen na grafikonu 2.5., a kumulativna kriva na grafikonu 2.6.
x Grafikon 2.5.
Histogram
x Grafikon 2.6.
Kumulativna kriva
2.4. MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Mjere srednje vrijednosti mogu biti potpune (izračunate, izvedene) i pozicione (položajne, nepotpune). U potpune mjere srednje vrijednosti 47
Statistika u ekonomiji i menadžmentu
ubrajamo aritmetičku, geometrijsku, harmonijsku, kvadratnu i kubnu sredinu. Pozicione mjere srednje vrijednosti su: mod, medijana i kvantili. 2.4.1. Aritmetička sredina Aritmetička sredina je prosječna srednja vrijednost. Aritmetička sredina jedne statističke serije je jednaka zbiru opservacija podijeljenim sa veličinom serije. Aritmetička sredina izražava prosječnu vrijednost jedne serije ili distribucije podataka i predstavlja najznačajniju mjeru centralne tendencije. 2.4.1.1. Jednostavna aritmetička sredina •
Aritmetička sredina negrupisane (neuređene) serije {xi; i = 1,...., N} se utvrđuje koristeći sljedeći izraz: x=
1 N
N
∑x
i
=
i =1
1 ( x1 + x2 ...... + xN ) N
(2.7)
Za seriju:
{xi } = { 2,0,10,8,4,0,6,4,6,2,6} , {xi; i=1,....,11} aritmetička sredina je jednaka
x= •
2 + 0 + 10 + 8 + 4 + 0 + 6 + 4 + 6 + 2 + 6 = 4,36 11
Aritmetička sredina uređene serije {x(i); (i)=1,..., N} gdje (i) predstavlja rang opservacije je jednaka: x=
1 N
N
∑x
i
i =1
=
1 ( x1 + x2 ...... + xN ) N
Za seriju:
{xi } = {0,0,2,2,4,4,6,6,6,8,10} , {x(i); (i)=1,....,11} aritmetička sredina je: 48
(2.8)
Poglavlje 2. – Analiza i sinteza podataka
x=
0 + 0 + 2 + 2 + 4 + 4 + 6 + 6 + 6 + 8 + 10 48 = = 4,36 11 11
2.4.1.2. Ponderisana aritmetička sredina •
Ponderisana
{( x ; f ) , j
aritmetička
j = 1, 2,...., J
j
}
sredina
grupisane
statističke
serije
gdje fj predstavlja frekvenciju modaliteta xj
je jednaka:
x=
1 N
J
∑f j =1
⋅ xj =
j
( f1 ⋅ x1 + f 2 ⋅ x2 + ... + f J ⋅ xJ )
(2.9)
N
Za seriju {( 0 ; 2 ), ( 2 ; 2 ), ( 4 ; 2 ), ( 6 ; 3 ), ( 8 ;1 ), ( 10 ;1 ) } , u kojoj su dati parovi u kojima prvi broj predstavlja modalitet a drugi frekvenciju, aritmetička sredina je jednaka: 6
x= x= •
∑f
j
j =1
xj
f1 x1 + f 2 x 2 + f 3 x3 + f 4 x 4 + f 5 x5 + f 6 x6 f1 + f 2 + f 3 + f 4 + f 5 + f 6
=
N
2 ⋅ 0 + 2 ⋅ 2 + 2 ⋅ 4 + 3 ⋅ 6 + 1 ⋅ 8 + 1 ⋅ 10 = 4,36 2 + 2 + 2 + 3 +1+1
Aritmetička sredina statističke serije sa relativnim frekvencijama je jednaka: J
x = ∑ p j x j gdje je p j = j =1
i
J
∑p j =1
•
j
fj N
(2.10)
=1
Aritmetička sredina statističke serije grupisane u intervale se utvrđuje primjenom sljedećeg izraza:
x=
1 N
J
∑f j =1
j
⋅ xc j =
( f ⋅x 1
c1
+ f 2 ⋅ xc2 + ... + f J ⋅ xcJ N
)
(2.11)
gdje xc predstavlja centar intervala i izračunava se pomoću sljedećeg izraza: 49
Statistika u ekonomiji i menadžmentu
xcj =
x j −1 + x j
(2.12)
2
(2; 2), (4 ; 2), (6 ; 3), (8;1), (10;1)} grupisanu u intervale predstavljamo u sljedećoj tabeli. Seriju
{(0 ; 2),
Tabela 2.3. Intervalno grupisana distribucija Intervali 0-2 4-6 8-10 Ukupno
Frekvencija 4 5 2 11
x≈
Centri razreda 1 5 9 -
4 ⋅1 + 5 ⋅ 5 + 2 ⋅ 9 = 4,27 11
Za izračunavanje aritmetičke sredine je potrebno primijeniti odgovarajuću formulu u zavisnosti od raspoloživih podataka. Aritmetičku sredinu možemo nazvati i centrom gravitacije, centrom koji predstavlja prosječnu vrijednost posmatrane serije kojoj teže, gravitiraju ostale vrijednosti u seriji. Aritmetička sredina izravnava apsolutne razlike između svih podataka u analiziranom skupu. Aritmetičku sredinu možemo računati samo za kvantitativne varijable. Dakle, za statističku seriju čije su varijable mjerene na nominalnoj i ordinalnoj skali ne možemo računati aritmetičku sredinu. 2.4.1.3. Osobine aritmetičke sredine •
Ako su vrijednosti svih obilježja u seriji jednake konstanti i aritmetička sredina je jednaka toj konstanti c:
x1 = x2 = .... = xN = c ⇒ x = c x=
50
1 N
N
∑ xi = i =1
1 N
N
1
∑ c = N ⋅ Nc = c i =1
(2.13)
Poglavlje 2. – Analiza i sinteza podataka
•
Aritmetička sredina je rijetko jednaka jednoj od posmatranih vrijednosti, ali promjena vrijednosti samo jednog modaliteta značajno utiče na aritmetičku sredinu. Zbog toga je aritmetička sredina vrlo osjetljiva na ekstremne vrijednosti posmatrane varijable. U računanju aritmetičke sredine uzimaju se vrijednosti svih modaliteta.
•
Aritmetička sredina je veća od najmanje i manja od najveće vrijednosti varijable3:
min xi < x < max xi •
(2.14)
Zbir odstupanja između modaliteta i njihove aritmetičke sredine je jednak nuli. N
N
i =1
i =1
∑ ( xi − x ) = ∑ xi − N ⋅ x = 0
(2.15)
Po analogiji, možemo pokazati da je zbir odstupanja svih vrijednosti obilježja od njihove aritmetičke sredine jednak nuli i za grupisane podatke. J
∑ f (x j =1
j
j
− x) = 0
(2.16)
Posljedica navedene osobine je sljedeća: aritmetička sredina odstupanja između opservacija i njihove aritmetičke sredine je jednaka nuli.
1 N
N
∑( x i =1
i
− x) = 0
(2.17)
Ova osobina vrijedi i u slučaju grupisanih podataka. •
Osobina agregiranja aritmetičke sredine
Ako na osnovu varijable X analiziramo populaciju veličine N sastavljenu od potpopulacije veličine N1, odgovarajuće aritmetičke sredine x1 i potpopulacije veličine N2, i njene aritmetičke sredine x2 . Aritmetička sredina varijable X za populaciju se dobija korištenjem sljedećeg izraza:
3
Izuzetak je slučaj kada su vrijednosti svih obilježja u seriji jednake konstanti, pa je i aritmetička sredina niza jednaka toj konstanti.
51
Statistika u ekonomiji i menadžmentu
x=
N1 x1 + N 2 x 2 f x + f 2 x2 = 1 1 N1 + N 2 f1 + f 2
(2.18)
Ova osobina se može generalizirati na n potpopulacija. Ilustraciju ove osobine ćemo pokazati na sljedećem primjeru. Tabela 2.4. Godišnje neto plate državnih službenika u 2000. godini Službenici
Frekvencija u hiljadama fj
Kategorija A Kategorija B Kategorija C Ukupno
Prosječna godišnja neto plata u eurima x
769,6 300,7 469,9 1540,2
29 549 21 698 17 576 ?
Izvor: Tableau de l’economie francaise (TEF), 2002-2003, INSEE, strana 93.
Prosječna godišnja neto plata svih službenika:
x= •
N1 x1 + N 2 x2 + N 3 x3 = 24 363,4€ N1 + N 2 + N 3
Aritmetička sredina zbira statističkih varijabli
Ovu osobinu ćemo ilustrovati na primjeru zbira dvije statističke varijable. Posmatrajmo za N domaćinstava podatke o njihovoj potrošnji ci i njihovoj štednji ši. Ako budžet domaćinstva i označimo sa bi za svako i možemo kompletirati sljedeću relaciju4:
bi = ci + ši ⇒ B = C + Š
b=
1 N
N
∑ bi = i =1
1 N
N
∑ (ci + ši ) = i =1
1 N
N
∑ ci + i =1
1 N
N
∑š i =1
i
=c +š
(2.19)
Aritmetička sredina zbira dvije statističke varijable je jednaka zbiru aritmetičkih sredina te dvije varijable. Dakle, ako imamo jednu statističku 4
52
Za označavanje modaliteta ili vrijednosti varijabli koristimo mala slova, a za označavanje statističkih varijabli koristimo velika slova.
Poglavlje 2. – Analiza i sinteza podataka
varijablu izraženu u obliku zbira dvije statističke varijable, njena aritmetička sredina je jednaka zbiru aritmetičkih sredina te dvije varijable. Ako je Z=X+Y, aritmetička sredina varijable Z je jednaka zbiru aritmetičkih sredina varijabli X i Y:
z=x+y
(2.20)
Ovu osobinu možemo generalizirati i zaključiti da je aritmetička sredina zbira n statističkih varijabli jednaka zbiru aritmetičkih sredina n statističkih varijabli. •
Aritmetička sredina linearne kombinacije statističkih varijabli
Linearnu kombinaciju statističkih varijabli definišemo sljedećom relacijom: yi = a + bxi
(2.21)
gdje su a i b parametri. Gornju relaciju možemo napisati u obliku Y = a+bX čija je aritmetička sredina jednaka:
y = a + bx
(2.22)
Navedenu osobinu možemo objasniti na sljedeći način. Ako sve opservacije pomnožimo jednim brojem tada će i aritmetička sredina biti pomnožena tim brojem. Ukoliko dodamo određeni broj svim opservacijama jedne serije, aritmetička sredina će biti uvećana za taj broj. Kada pomnožimo sve ocjene iz jednog predmeta sa 2 tada će i aritmetička sredina ocjena iz tog predmeta biti pomnožena sa 2. Ako dodamo 5 poena svim ocjenama iz jednog predmeta, aritmetička sredina ocjena iz tog predmeta se uvećava za 5 poena. Na ovaj način definisane su osobine aditivnosti i linearnosti aritmetičke sredine. Posebnu pažnju treba obratiti na izračunavanje aritmetičke sredine u slučaju intervalno grupisane distribucije sa stvarnim intervalima. 2.4.2. Geometrijska sredina Geometrijska sredina za serije negrupisanih podataka je jednaka N- tom korijenu iz proizvoda vrijednosti varijable i izračunava se prema sljedećoj formuli: 53
Statistika u ekonomiji i menadžmentu N
G = N x1 ⋅ x2 ⋅ .... ⋅ x N = N ∏ xi , xi > 0 , i = 1, N
(2.23)
i =1
Za izračunavanje geometrijske sredine jedne serije koriste se svi podaci i potrebno je da budu pozitivni. Logaritamski oblik ove funkcije praktičniji za primjenu dat je sljedećim izrazom:
log G =
1 N
N
∑ log x i =1
(2.24)
i
Konstatujemo da je logaritam geometrijske sredine varijable X jednak aritmetičkoj sredini logaritama njenih vrijednosti. Geometrijska sredina statističke distribucije frekvencije je jednaka: J
J
G = N x1f1 ⋅ x2f2 ⋅ .... ⋅ xJf J = N ∏ x j j , N = ∑ f J , x j > 0, j = 1, J f
j =1
(2.25)
j =1
Logaritamski oblik ponderisane geometrijske sredine je izražen sljedećom relacijom:
log G =
J 1 J log , f x N = fj ∑ j j ∑ N j =1 j =1
(2.26)
Geometrijska sredina se najčešće primjenjuje u slučajevima kada se pojave ponašaju po geometrijskoj progresiji, za izračunavanje prosječnih pokazatelja porasta i razvoja u dinamičkoj analizi pojava, za izračunavanje srednje vrijednosti vremenskih serija i kod lančanih indeksa. Geometrijska sredina izravnava odnose, tj. proporcionalne promjene između uzastopnih podataka u analiziranoj seriji. 2.4.3. Harmonijska sredina Harmonijska sredina se definiše kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti varijable X. Harmonijska sredina za seriju negrupisanih podataka se izračuna pomoću sljedećeg izraza:
54
Poglavlje 2. – Analiza i sinteza podataka
H=
N
=
N
1 ∑ i =1 xi
N 1 1 1 1 + + ... + + ... + x1 x2 xi xN
, xi ≠ 0
(2.27)
Harmonijska sredina za statističku distribuciju frekvencija je data izrazom: J
H=
∑ j =1 J
∑ j =1
J
fj
f + f 2 + ... + fi + ... + f J + = 1 = fi fJ f1 f 2 fj + + ... + + ... + x1 x2 xi xJ xj
∑f j =1 J
fj
∑x j =1
j
, xj ≠ 0
(2.28)
j
Postupak izračunavanja ove sredine je jednostavan. Poteškoća je u uočavanju slučajeva u kojima se može primijeniti. Izračunava se u slučaju kada su originalni podaci izraženi u vidu recipročnih veličina. Recipročne veličine se kreću u obrnutom pravcu od kretanja pojave koju izražavaju. Produktivnost rada je tipičan primjer primjene ove sredine jer veća produktivnost rada znači veću proizvodnju uz manji utrošak rada. Ako su sve vrijednosti varijable pozitivne, vrijedi sljedeća relacija odnosa izmedu tri analizirane potpune mjere srednje vrijednosti: min xi ≤ H ≤ G ≤ x < max xi
(2.29)
2.4.4. Kvadratna i kubna sredina Kvadratna sredina se izražava u sljedećem obliku: N
∑x
x2 =
2 i
i =1
(2.30)
N
Kubna sredina je data sljedećim izrazom: N
x3 =
3
∑x i =1
3 i
N
(2.31)
Odnos između pet prezentiranih sredina je sljedeći: min xi ≤ H ≤ G ≤ x ≤ x 2 ≤ x 3 < max xi
(2.32)
55
Statistika u ekonomiji i menadžmentu
2.4.5. Mod ili centar aktivnosti Mod je jedna od najstarijih pozicionih vrijednosti koja se jednostavno utvrđuje. Mod se definiše kao modalitet varijable koji se najčešće pojavljuje, tj. modalitet koji ima najveću frekvenciju. Najčešći su slučajevi unimodalnih serija. Međutim, potrebno je naglasiti da serija može biti bimodalna ili višemodalna ukoliko se u jednoj seriji nalazi više modaliteta koji imaju najvišu frekvenciju. Primjer 2.3. Određivanje moda Tabela 2.5. Nastavnici sa punim radnim vremenom na visokoškolskim ustanovama u Federaciji Bosne i Hercegovine u 2001/2002 godini Nastavnici Redovni profesor Vanredni profesor Docent Ostali Ukupno
Frekvencije u fj 332 248 251 50 881
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine, Federalni zavod za statistiku, Sarajevo, 2002.
Mod je, kao što smo već naglasili, modalitet varijable koji ima najveću frekvenciju. To je u našem primjeru modalitet redovni profesor. Grafički je vrlo jednostavno u ovom slučaju odrediti mod. 350 300 250 200 150 100 50 0
MOD
Redovni profesor Grafikon 2.7.
Vanredni profesor
Docent
Ostali
Nastavnici na visokoškolskim institucijama u Federaciji Bosne i Hercegovine u 2001/2002.
U slučaju intervalno grupisanih distribucija, poslije određivanja modalnog intervala koji ima najveću frekvenciju (ili najveću frekvenciju po jedinici 56
Poglavlje 2. – Analiza i sinteza podataka
amplitude u slučaju da intervali nemaju istu amplitudu), mod možemo izračunati linearnom interpolacijom korištenjem sljedeće formule:
M o = xMo + aMo ⋅
f 2 − f1 ( f 2 − f1 ) + ( f 2 − f 3 )
(2.33)
gdje je: xMo lijeva granica modalnog intervala,
aMo f1 f2 f3
amplituda (širina) modalnog intervala, frekvencija prethodnog intervala, frekvencija modalnog intervala, frekvencija narednog intervala.
Tabela 2.6. Starosna struktura stanovništva Federacije BiH u 2000. godini Starosna struktura xj 0-14 15-64 65 i više Ukupno
Amplituda intervala aj 15 50 26 -
Broj stanovnika fj 588 210 1 896 277 316 513 2 801 000
Gustoća intervala ili korigovana frekvencija fj / a j 39 214 37 925,5 12 173,6 -
U ovom primjeru intervali nemaju jednake amplitude pa je za utvrđivanje modalnog intervala potrebno izračunati broj stanovnika po jedinici amplitude (dijeli se frekvencija broj stanovnika sa amplitudom intervala) ili gustoću intervala da bi se odredila modalna klasa. U ovom slučaju modalna klasa je klasa od 0 do 14. U slučaju da koristimo relativne frekvencije formula je analogna gore navedenoj, osim što umjesto apsolutne frekvencije fj koristimo relativnu frekvenciju pj. Postoji i sljedeća formula pomoću koje možemo utvrditi aproksimativnu vrijednost moda u unimodalnim i nesimetričnim distribucijama: Mo ≈ 3Me-2
(2.34)
Prema ovom izrazu, mod je približno jednak tri medijane umanjene za dva. 57
Statistika u ekonomiji i menadžmentu
Modalna klasa zavisi od grupisanja u intervale koje smo prethodno izvršili. Kao i uvijek prije i poslije određivanja moda u svakom konkretnom slučaju treba se upitati: Da li ovaj pokazatelj ima smisla i da li nam omogućava ili ne dodatnu korisnu informaciju? 2.4.6. Medijana ili centar pozicije Medijana spada u pozicione srednje vrijednosti. Medijana je vrijednost obilježja koja u seriji uređenoj po veličini (rastućem ili opadajućem redosljedu) zauzima centralnu poziciju (rang) i dijeli seriju na dva jednaka dijela. Njena teorijska kumulativna frekvencija je 50%. Dakle, teorijski 50% podataka ima vrijednost manju ili jednaku medijani i preostala polovina podataka vrijednosti veće od medijane. Medijana je poziciona srednja vrijednost i za izračunavanje medijane nisu bitne vrijednosti svih podataka nego njihov rang u seriji. 2.4.6.1. Određivanje medijane u uređenoj seriji Određivanje medijane zavisi od broja podataka u seriji. Analiziraćemo slučajeve određivanja medijane ukoliko je broj podataka neparan i ukoliko je broj podataka paran. •
Neparan broj podataka
U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N neparan broj podataka, medijana se izračunava koristeći sljedeću formulu:
Me = x⎛ N +1 ⎞
(2.35)
⎜ ⎟ ⎝ 2 ⎠
Uređena statistička serija od 11 podataka: 1 2 3 4 5 6 7 8 9 42 48 53 58 60 64 68 79 88
Rang (i): Podaci (xi):
Me = x⎛ N +1 ⎞ = x ⎛ 9 +1 ⎞ = x (5) = 60 ⎜ ⎟ ⎝ 2 ⎠
58
⎜ ⎟ ⎝ 2 ⎠
Poglavlje 2. – Analiza i sinteza podataka
•
Paran broj podataka
U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N paran broj podataka medijana se izračunava koristeći sljedeću formulu: x⎛ N ⎞ + x⎛ N ⎞ ⎜ +1⎟ ⎝2 ⎠
⎜ ⎟ ⎝2⎠
Me =
(2.36)
2
U uređenoj seriji veličine 10: 1 2 3 4 5 6 7 8 9 10 42 48 53 58 60 64 68 79 88 90
Rang (i): Podaci (xi):
x⎛ N ⎞ + x⎛ N Me =
⎞ ⎜ +1 ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2⎠
2
x⎛ 10 ⎞ + x⎛ 10 =
⎞ ⎜ +1 ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2 ⎠
2
=
x(5) + x( 6) 2
=
60 + 64 = 62 2
2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija Tabela 2.7. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004. g. Broj soba xj 1 2 3 4 5 Ukupno
Frekvencije fj 184 238 115 35 2 574
Rang (i) 1 - 184 185 - 422 423 - 537 538 - 572 573 - 574
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.
Medijana je jednaka aritmetičkoj sredini modaliteta koji zauzima rang 287 (574/2=287) i modaliteta koji zauzima rang 288.
x⎛ N ⎞ + x⎛ N Me =
⎞ ⎜ +1⎟ ⎝2 ⎠
⎜ ⎟ ⎝2⎠
2
=
x( 287 ) + x( 288) 2
=
2+2 =2 2 59
Statistika u ekonomiji i menadžmentu
U seriji grupisanoj u intervale, medijana se računa na sljedeći način:
N − S Me−1 Me = xMe + aMe ⋅ 2 f Me
(2.37)
gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala, aMe frekvencija medijanskog intervala, fMe SMe-1 kumulativna frekvencija predmedijanskog intervala, N zbir svih frekvencija. Praktičnije je računati medijanu ukoliko koristimo kumulativne relativne frekvencije:
Me = xMe + a Me ⋅ = xMe
F ( Me) − FMe−1 p Me
0,50 − FMe−1 + a Me ⋅ p Me
(2.38)
gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala aMe
FMe FMe-1 pMe
teorijska kumulativna relativna frekvencija medijane, kumulativna relativna frekvencija predmedijanskog intervala, relativna frekvencija medijanskog intervala.
Medijana se grafički može odrediti na osnovu kumulativnog dijagrama frekvencija. Kumulativnu krivu dobijemo spajanjem kumulativnih frekvencija koje odgovaraju svakom modalitetu ili u slučaju intervalno grupisanih serija gornjim granicama svakog intervala. 2.4.6.3. Medijana i kumulativna frekvencija U uređenoj seriji (klasiranoj po rastućem ili opadajućem redosljedu podataka) broj podataka koji prethode medijani je jednak broju podataka 60
Poglavlje 2. – Analiza i sinteza podataka
koji se nalaze poslije medijane. Na osnovu ove definicije mogli bismo zaključiti da je kumulativna frekvencija medijane uvijek jednaka 50 %. Provjerićemo da li je to tačno na jednom primjeru za koji smo neophodne podatke kompletirali i prezentirali u tabeli 2.8. Tabela 2.8. Određivanje kumulativne frekvencije medijane Opservacije Rang Frekvencije Kumulativne Relativne Kumulativne fi (i) frekvencije frekvencije relativne x(i) Si frekvencije pi Fi
42 48 50 52 54 58 58 58 64 68 70 Ukupno
1 2 3 4 5 6 7 8 9 10 11 -
1 1 1 1 1 1 1 1 1 1 1 11
1 2 3 4 5 6 7 8 9 10 11
0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,99≈1,00
0,09 0,18 0,27 0,36 0,45 0,54 0,63 0,72 0,81 0,90 0,99≈1,00
Me = x⎛ N +1 ⎞ = x⎛ 11+1 ⎞ = x( 6) = 58 ⎜ ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2 ⎠
Konstatujemo da 5 podataka prethodi medijani koja je jednaka 58 i 5 podataka se nalazi poslije medijane. Uočavamo da se podatak 58 ponavlja tri puta i da je kumulativna rastuća frekvencija ovog modaliteta jednaka 0,72 (dakle 72%), što je znatno više od 50% koliko je teorijska kumulativna frekvencija medijane. Dakle, u slučaju kada jedna vrijednost zauzima centralni rang u seriji, ali i više ostalih rangova, odgovarajuća kumulativna frekvencija se može znatno razlikovati od teorijski pretpostavljene.
61
Statistika u ekonomiji i menadžmentu
2.4.6.4. Karakteristike medijane Medijana je parametar centralne pozicije u seriji na koju ekstremne vrijednosti nemaju uticaja jer medijana ne zavisi od vrijednosti podataka nego od njihovog ranga, pozicije u seriji. Ako su npr. greškom evidentirane neke ekstremne vrijednosti one neće uticati na medijanu. Posmatrajmo dvije uređene serije veličine 11: Rang (i): Varijabla X1: Varijabla X2:
1 2 3 4 5 6 7 8 9 10 11 42 48 50 52 54 58 59 63 74 78 80 42 48 50 52 54 58 59 63 74 78 200
U oba slučaja medijana je jednaka 58. Kako u uređenoj seriji polovina podataka prethodi medijani i polovina podataka se nalazi poslije medijane, medijana se naziva također kvantil reda 0,5 (ili reda 50%). 2.4.7. Kvantili U uređenoj seriji {x(i)} kvantil reda p koji označavamo sa xp je jednak vrijednosti varijable za koju postoji proporcija opservacija koje su jednake ili manje od xp i komplementarna proporcija (1-p) opservacija koje su veće od xp:
F (xp ) ≤ N ⋅ p
i F * ( x p ) > N (1 − p)
0 < p N (1 − p )
0 < p 1 −
1 , k >1 k2
(2.81)
Primjenu ove teoreme ilustrujemo na sljedećem primjeru. Pretpostavimo da je poznata prosječna mjesečna plata 460 eura, standardna devijacija 180 eura i k=2. Primjenom Čebiševe teoreme dobijamo: 77
Statistika u ekonomiji i menadžmentu
x ± kσ = 460 ± 2 ⋅ 80 = [300 ; 620] 1 1 1 − 2 = 1 − 2 = 75% k 2 Prema teoremi Čebiševa, najmanje 75% plata ove distribucije se nalaze u intervalu između 300 i 620 eura. Primjena ove teoreme omogućava procjenu moguće vrijednosti neke varijable i raspona varijacije u kojem se očekuje određena proporcija modaliteta. U pravilu, vrijednosti varijable rijetko odstupaju od aritmetičke sredine za više od tri standardne devijacije. Ova teorema se koristi za definisanje karakterističnih intervala u inferencijalnoj statistici. 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije Na osnovu podataka datih u tabeli 2.11. predstavit ćemo grafičku sintezu parametara pozicije i disperzije. Tabela 2.11. Distribucija neto plata u preduzećima u Francuskoj u 2000.g. grupisana prema decilima Decili
D1 D2 D3 D4 Medijana=D5 D6 D7 D8 D9
Godišnje plate u eurima xj 10 780 12 490 13 930 15 420 17 130 19 200 22 030 26 470 35 700
Kumulativne frekvencije Fj u % 10 20 30 40 50 60 70 80 90
Izvor: Tableau d’économie francaise (TEF) 2002-2003, INSEE, Paris, str. 91.
Na osnovu podataka iz tabele konstruisali smo kumulativnu krivu, grafički i analitički odredili kvartile i konstruisali box plot.
78
Poglavlje 2. – Analiza i sinteza podataka decili u % 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
godišnje plate (u 000 €)
xmin
Grafikon 2.9.
Q1
Me
Q3
13, 210
17,130
24, 250
Kumulativna kriva godišnjih neto plata u eurima
Medijanska plata je 17130 €. To znači da je 50% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako 17130 €. Prvi kvartil Q1 je 13210 € što pokazuje da je 25% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 13210 € . Vrijednost trećeg kvartila nam daje informaciju da je 75% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 24250 €. 2.5.5. Pregled mjera srednje vrijednosti i varijacije U šemi 2.1. dajemo pregled mjera srednje vrijednosti i varijacije koje smo analizirali za kvantitativnu statističku varijablu.
79
Statistika u ekonomiji i menadžmentu
Kvantitativna varijabla
Mjere srednje vrijednosti
Potpune
Mjere varijacije
Pozicione
Apsolutne
Relativne
Aritmeticka sredina
Medijana
Raspon varijacije
Koeficijent varijacije
Geometrijska sredina
Mod
Srednje apsolutno odstupanje
Koeficijent kvartilne devijacije
Harmonijska sredina
Kvantili
Varijansa
Interkvantilna relativna odstupanja
Kvadratna sredina
Standardna devijacija
Kubna sredina
Interkvantilna odstupanja
Šema 2.1.
Interkvartilno Interdecilno Intercentilno
Mjere srednje vrijednosti i varijacije
2.6. MJERE OBLIKA DISTRIBUCIJE 2.6.1. Momenti distribucije frekvencija Za konstrukciju parametara oblika distribucije frekvencije koristimo centralne momente distribucije frekvencija koji se definišu na bazi višestepenih odstupanja vrijednosti varijable od aritmetičke sredine. Centralni moment r-tog reda je dat sljedećim izrazima: •
za negrupisanu seriju:
μr =
80
1 N
N
∑ (x − x) i
i =1
r
, r ∈ [ 0,1,..., N ]
(2.82)
Poglavlje 2. – Analiza i sinteza podataka
•
za statističku distribuciju frekvencija:
μr =
1 N
J
∑ f (x j
j =1
− x ) , r ∈ [ 0,1,..., N ] r
j
(2.83)
2.6.2. Mjere asimetrije Razlikuju se tri tipa distribucije: simetrična, lijevo asimetrična i desno asimetrična. Često nam analiza dijagrama u stupcima ili histograma omogućava da uočimo da li je distribucija simetrična ili ne. Analiza boxplota nam omogućava također da konstatujemo simetriju ili asimetriju distribucije. Pored navedenih, konstruisani su i specifični pokazatelji za mjerenje asimetrije koji mjere asimetriju u odnosu na pravac: x = x . Polazna veličina za mjerenje asimetrije je treći momenat oko aritmetičke sredine koji je jednak aritmetičkoj sredini odstupanja vrijednosti varijable od aritmetičke sredine podignutih na treći stepen. Za negrupisane podatke moment trećeg reda je jednak: N
μ3 =
∑ (x − x ) i =1
3
i
(2.84)
N
Za grupisanu distribuciju frekvencija treći moment oko sredine je jednak: J
μ3 =
∑ f (x j =1
j
N
j
− x)
3 J
,
N = ∑ fj
(2.85)
j =1
Analiza osobina ovog parametra omogućava da konstatujemo da je u slučaju simetrične distribucije brojnik navedenih izraza jednak nuli i treći momenat oko sredine jednak nuli. U slučaju desne asimetrije moment trećeg reda je pozitivan. Za lijevo asimetričnu distribuciju moment trećeg reda je negativan:
μ3 = 0 simetrija μ3 > 0 desna asimetrija μ3 < 0 lijeva asimetrija
(2.86)
81
Statistika u ekonomiji i menadžmentu
Moment trećeg reda zavisi od jedinica mjere u kojima je izražena varijabla i zbog toga je njegova direktna primjena otežana. Da bi otklonio taj nedostatak. Ficher je predložio sljedeći koeficijent asimetrije:
α3 =
μ3 σ3
(2.87)
Ovaj koeficijent predstavlja relativnu mjeru smjera i veličine asimetrije:
α 3 = 0 simetrija α 3 > 0 desna asimetrija α 3 < 0 lijeva asimetrija
(2.88)
Vrijednost Ficherovog koeficijenta asimetrije se najčešće nalazi u intervalu [-2;+2]. Postoje i drugi koeficijenti asimetrije koji su brži za računanje, a čije osobine proizilaze iz empirijskih iskustava. To su: •
Pearsonov koeficijent:
Sk =
x − MO
σ
(2.89)
koji je predstavljen kao standardizirano odstupanje moda od aritmetičke sredine. Najčešća vrijednost ovog koeficijenta se nalazi u intervalu [-3;+3]. Pearsonov koeficijent je nepotpuna mjera asimetrije:
S k = 0 simetrija S k > 0 desna asimetrija
(2.90)
S k < 0 lijeva asimetrija •
Koeficijent Yule i Kendall je jednak sljedećem izrazu:
Yk =
Q1 + Q3 − 2M e , - 1 ≤ Yk ≤ 1 Q3 − Q1
Yk = 0 simetrija Yk > 0 desna asimetrija Yk < 0 lijeva asimetrija 82
(2.91)
Poglavlje 2. – Analiza i sinteza podataka
Na grafikonu 2.10. je predstavljena simetrična distribucija. Kod simetrične distribucije aritmetička sredina, mod i medijana su jednaki. M0 = Me = x
fj
μ 3 = 0 ⇒ a3 = 0; Sk = 0
xj
x Grafikon 2.10.
Odnos parametara kod simetrične distribucije
Za desno asimetričnu distribuciju aritmetička sredina je veća od medijane i moda. Relativna mjera asimetrije je pozitivna.
fj
Mo < Μe < x
μ 3 > 0, ⇒ a3 > 0; Sk > 0
Mo Grafikon 2.11.
Me
x
xj
Asimetrična distribucija – desna asimetrija
Za lijevo asimetričnu distribuciju aritmetička sredina je manja od medijane i moda. Relativna mjera asimetrije je negativna.
83
Statistika u ekonomiji i menadžmentu
x < Me < Mo
μ 3 < 0 ⇒ a3 < 0; Sk < 0
fj
x Grafikon 2.12.
Me
Mo
xj
Asimetrična distribucija – lijeva asimetrija
2.6.3. Parametri spljoštenosti Konstrukcija parametara spljoštenosti je bazirana na četvrtom momentu oko sredine:
1 N 1 μ4 = N
μ4 =
N
∑(x
i
i =1 J
∑f j =1
− x)
4
j
J
(x j − x ) , N = ∑ f j 4
(2.92)
j =1
Četvrti moment oko sredine je prosječno odstupanje vrijednosti varijable od njene aritmetičke sredine podignuto na četvrti stepen. Zaobljenost se upoređuje i mjeri prema zaobljenosti modalnog vrha normalne distribucije koristeći sljedeće koeficijente: Pearsonov koeficijent zaobljenosti:
α4 =
μ4 σ4
(2.93)
Ficherov koeficijent zaobljenosti je jednak:
ϕ4 =
84
μ4 −3 σ4
(2.94)
Poglavlje 2. – Analiza i sinteza podataka
Za normalnu distribuciju koeficijenata: α 4 = 3 ⇒ ϕ4 = 0
frekvencija
vrijede
sljedeće
vrijednosti
(2.95)
Spljoštenost ostalih distribucija mjerimo u odnosu na normalnu. Ako je α 4 > 3 ⇒ ϕ 4 > 0 distribucija je uža, šiljastija od normalne, a ako je α 4 < 3 ⇒ ϕ 4 < 0 distribucija je šira, spljoštenija od normalne. Ficherov koeficijent je jednostavniji za upotrebu. Ako je distribucija šiljastija, vrijednost koeficijenta je veća. Manja vrijednost koeficijenta ukazuje na spljoštenost distribucije. Na grafikonu 2.13. su prezentovana tri tipa spljoštenosti distribucije. fj
normalna distribucija
a4 = 3; ϕ4 = 0 a4 > 3; ϕ4 > 0 a4 < 3; ϕ4 < 0
x Grafikon 2.13.
xj
Mjere spljoštenosti distribucije
Excel nam pruža mogućnost dobijanja sumarnog pregleda ocjena parametara koje smo analizirali.
85
Statistika u ekonomiji i menadžmentu
Rezultati našeg primjera ocjena na ispitu iz Statistike dobijeni u Excelu su predstavljeni u tabeli 2.12. Tabela 2.12. Output Excela za analizu ocjena na ispitu iz Statistike Descriptive Statistics Mean 8,235294118 Standard Error 0,239051988 Median 8 Mode 10 Standard Deviation 1,393900643 Sample Variance 1,942959002 Kurtosis -1,291933142 Skewness -0,09156866 Range 4 Minimum 6 Maximum 10 Sum 280 Count 34
U tabeli u prilogu je dat prijevod tabele 2.12. 86
Poglavlje 2. – Analiza i sinteza podataka
Prosječna ocjena je 8,2, medijana je 8, a ocjena koja je bila najčešća je 10. Standardna devijacija je 1,39. To znači da su u prosjeku ocjene odstupale oko aritmetičke sredine za 1,39.
2.7. MJERE KONCENTRACIJE Mjere koncentracije analiziraju način raspodjele agregatnih veličina ili globalnih vrijednosti na modalitete statističkih varijabli. Mjere koncentracije se dijele na apsolutne i relativne. Najpoznatije apsolutne mjere koncentracije su koncentracijski omjer i Herfindahlov indeks. Relativne mjere koncentracije se nazivaju i mjere nejednakosti u raspodjeli agregatnih veličina. Među najpoznatije mjere koncentracije ubrajaju se Lorenzova kriva ili kriva koncentracije i Ginijev koeficijent. Mi ćemo prezentovati i analizirati relativne mjere koncentracije. 2.7.1. Lorenzova kriva Lorenzova kriva se konstruiše u pravougaonom koordinatnom sistemu na osnovu relativnih kumulativnih frekvencija i relativne kumulativne globalne vrijednosti. Globalna vrijednost predstavlja proizvod fj xcj u kojem je fj frekvencija intervala čiji je centar xcj. Na apscisu se nanose kumulativne relativne frekvencije F j a na ordinatu relativne kumulativne globalne vrijednosti Q j . Kategorije koje koristimo u analizi mjera koncentracije formaliziramo na sljedeći način: Fj =
∑p
x≤ x j
j
; Qj =
∑q
x≤ x j
j
;
pj =
fj N
;
qj =
xj fj N
∑x j =1
j
fj
N
;
∑p j =1
j
=
N
∑q j =1
j
=1
(2.96) Dvije kumulativne frekvencije Fj i Qj variraju u intervalu [0;1]. Da bismo nacrtali Lorezovu krivu prvo konstruišemo kvadrat čije su strane jednake jedinici kao na grafikonu 2.14. Ovaj kvadrat je poznat pod imenom Ginijev kvadrat. Dijagonala kvadrata odgovara liniji jednake raspodjele. Lorenzova kriva se nalazi u trouglu čija tjemena imaju koordinate (0,0), (1,1) i (0,1). Potpuna nejednakost u raspodjeli je određena katetama trougla (0,1) i (1,1). Kada se kriva više udaljava od dijagonale koncentracija je veća i raspodjela je neravnomjernija i obrnuto. 87
Statistika u ekonomiji i menadžmentu
1
potpuna jednakost
Lorenzova kriva
potpuna nejednakost
0
1
Grafikon 2.14.
Lorenzova kriva
Na grafikonu 2.15. je predstavljena Lorenzova kriva u slučaju kada kumulativne frekvencije Fj i Qj izrazimo u procentima. 100 90 80 70 60
Q (u %)
50 40 30 20 10 0
10
20
30
40
50
60
F (u %) Grafikon 2.15.
88
Lorenzova kriva
70
80
90
100
Poglavlje 2. – Analiza i sinteza podataka
Na sljedećem primjeru ćemo ilustrovati konstrukciju Lorenzove krive. Primjer 2.5. Tabela 2.13. Dio agregiranih prihoda u % koje je primila svaka četvrtina od ukupnog broja domaćinstava u državi X. Godina 2000 2005
Broj domaćinstava 650 000 690 000
1/4 4,5 3,5
2/4 15,5 12,5
3/4 22,5 19,5
4/4 57,5 64,5
100 100
U 2000, 25% domaćinstava čiji su prihodi bili najniži su primili 4,5% agregiranih prihoda, što znači 4,5 % od ukupne mase prihoda svih 650000 domaćinstava. 50% domaćinstava sa najnižim primanjima su dobijali 20% od ukupne mase primanja svih domaćinstava, a 25% domaćinstava čiji su prihodi bili najviši su dobijali 57,5% agregiranih prihoda. U ovom slučaju koncentracija prihoda je vrlo izražena zato što jedan mali procenat domaćinstava (25%) prima veliki procenat mase ukupnih prihoda svih domaćinstava. Pokazatelji koncentracije mjere u ovom slučaju nejednakost u raspodjeli mase ukupnih prihoda domaćinstava. Nejednakost u raspodjeli ukupne mase prihoda domaćinstava se povećala u 2005.g. 25% najbogatijih domaćinstava je raspolagalo sa 64,5% mase ukupnih prihoda, a preostalih 75% domaćinstava raspolažu sa 35,5% mase ukupnih prihoda. U ovom slučaju koncentracija je jaka zato što jedan mali procenat domaćinstava prima veliki procenat mase ukupnih prihoda svih domaćinstava. Da bismo konstruisali Lorenzovu krivu za gore navedene podatke potrebno je kompletirati radnu tabelu za 2000. i za 2005. godinu: Tabela 2.14. Radna tabela za 2000. godinu Frekvencija pj u % 25 25 25 25
Agregatna primanja qj u % 4,5 15,5 25,5 54,5
Kumulativna frekvencija Fj u % 25 50 75 100
Kumulativni agregat Qj u % 4,5 20 45,5 100
89
Statistika u ekonomiji i menadžmentu
Tabela 2.15. Radna tabela za 2005. godinu Frekvencija pj u % 25 25 25 25
Agregatna primanja qj u % 3,5 12,5 19,5 64,5
Kumulativna frekvencija Fj u % 25 50 75 100
Kumulativni agregat Qj u % 3,5 16 35,5 100
Na osnovu podataka o kumulativnim frekvencijama i kumulativnom agregatu iz radnih tabela konstruisali smo Lorenzovu krivu za 2000.g. i za 2005.g.
100 2005. godina 2000. godina
Q (u %)
0
Grafikon 2.16.
F (u %)
100
Lorenzova kriva
Na osnovu položaja Lorenzovih krivih u odnosu na liniju jednake raspodjele možemo konstatovati da je došlo do porasta nejednakosti u raspodjeli mase ukupnih prihoda između domaćinstava u 2005.g. u odnosu na 2000.g.
90
Poglavlje 2. – Analiza i sinteza podataka
2.7.2. Ginijev koeficijent Ginijev koeficijent je relativna mjera koncentracije i definisan je kao odnos površine između Lorenzove krive i pravca jednake raspodjele i površine trougla koji se nalazi ispod dijagonale koja predstavlja pravac jednake raspodjele. Površina između Lorenzove krive i pravca jednake raspodjele se naziva i površina koncentracije. Ginijev koeficijent G se izračunava korištenjem sljedeće relacije:
G=
Površina koncentracije S = = 2S Površina trougla 0,5
(2.97)
Površina trougla je jednaka 0,5. Ginijev koeficijent je jednak dva puta površina koncentracije i kreće se u intervalu [0;1]. Kada je ova površina veća, nejednakost u raspodjeli je značajnija. Dva granična slučaja su vrijednosti koeficijenta jednake nuli i jedinici. Kada je Ginijev koeficijent jednak nuli, koncentracija je jednaka nuli i postoji perfektna jednakost u raspodjeli mase primanja. Ako je Ginijev koeficijent jednak jedinici koncentracija je maksimalna i postoji maksimalna nejednakost u raspodjeli ukupne mase primanja. Npr. jedna osoba prima ukupnu masu, dok ostali ne primaju ništa. Dakle, veća vrijednost Ginijevog koeficijenta odgovara većoj koncentraciji i većoj nejednakosti u raspodjeli. Ginijev koeficijent se može izračunati primjenom metode trapeza koja je praktičnija i grafički se jednostavnije ilustruje i metodom trouglova.
91
Statistika u ekonomiji i menadžmentu
2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza
100
Q (u %)
Qj
Q j −1
a
(a + c ) ⋅ h 2
F j −1
0
h
c Fj
100
F (u %) Lorenzova kriva
Grafikon 2.17.
Formula za računanje Ginijevog koeficijenta metodom trapeza: ⎡1 G = 2⋅⎢ − ⎣2 ⎡1 G = 2⋅⎢ − ⎢2 ⎣
∑ ∑
(a + c) ⋅ h ⎤ ⎥ 2 ⎦
(Q
j −1
)(
)
+ Q j ⋅ F j − F j −1 ⎤ ⎥ 2 ⎥ ⎦
G = 1 − ∑ p j ⋅ (Q j −1 + Q j )
(2.98)
Ako koristimo relativne frekvencije izražene u procentima, formula za izračunavanje Ginijevog koeficijenta je jednaka sljedećem izrazu:
92
Poglavlje 2. – Analiza i sinteza podataka
G = 1−
1 104
∑ p (Q j
j −1
+ Qj )
(2.99)
Na osnovu analiziranog primjera izračunat ćemo Ginijev koeficijent za 2000. godinu korištenjem metode trapeza. G = 1 − [ 0, 25 ⋅ (0 + 0, 045) + 0, 25 ⋅ (0, 045 + 0, 20) +
+0, 25 ⋅ (0, 20 + 0, 455) + 0, 25 ⋅ (0, 455 + 1)]
G 2000 =0,41 Ginijev koeficijent za 2000. godinu je jednak 0,41. Na isti način računamo Ginijev koeficijent za 2005. godinu:
G = 1 − [ 0, 25 ⋅ (0 + 0, 035) + 0, 25 ⋅ (0, 035 + 0,16) +
+ 0, 25 ⋅ (0,16 + 0,355) + 0, 25 ⋅ (0,355 + 1) ]
G 2005 =0,48 Ginijev koeficijent za 2005. godinu je jednak 0,48. Ginijev koeficijent u 2005.g. je veći od Ginijevog koeficijenta u 2000.g. Izračunate vrijednosti Ginijevog koeficijenta potvrđuju da je nejednakost u raspodjeli, odnosno koncentracija mase agregatnih prihoda bila veća u 2005. godini. Do istog zaključka smo došli analizirajući Lorenzovu krivu. 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova Za statističku kvantitativnu neprekidnu varijablu čiji su podaci grupisani u J intervala površina koncentracije može biti definisana kao skup J trouglova. Na tom osnovu je definisana metoda trouglova za izračunavanje Ginijevog koeficijenta prema sljedećoj formuli: J −1
G = ∑ (F j Q j +1 − F j +1Q j )
(2.100)
j =1
U konkretnim primjerima je dovoljno kompletirati radnu tabelu računajući za svaki interval vrijednosti F j Q j +1 − F j +1Q j . Zbir svih tako izračunatih
(
)
vrijednosti predstavlja Ginijev koeficijent koncentracije. 93
Statistika u ekonomiji i menadžmentu
U tabeli 2.16. su dati podaci o izračunatim indeksima nejednakosti u raspodjeli potrošnje stanovništva Bosne i Hercegovine i entiteta. Tabela 2.16. Indeksi nejednakosti za BiH i entitete u 2001.g. Indeks nejednakosti Decilni omjeri potrošnje po stanovniku (omjer potrošnje od bogatih do siromašnih) 90/10 postotni omjer Od srednjih ka siromašnim (50/10) Bogati ka srednjim (90/50) Kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji Najsiromašnijih 20% stanovništva Donja sredina 20% Sredina 20% Gornja sredina 20% Najbogatijih 20% stanovništva Ostali indeksi nejednakosti Gini indeks Devijacija srednjeg loga (Theil) Indeks entropije Gini indeks: koristeći OECD skalu
BiH
RS
FBiH
3,29 1,82 1,81
3,49 2,00 1,74
3,13 1,74 1,80
9,5 14,2 17,9 22,7 35,8
9,2 14,3 18,3 23,1 35,1
9,9 14,2 17,7 22,5 35,8
0,26 0,11 0,12 0,24
0,26 0,11 0,11 0,24
0,26 0,11 0,12 0,23
Izvor: Bosnia and Herzegovina: Poverty Assessment, Volume II: Data on Poverty, Report No.25343-BiH, Document of the World Bank, 2003. g., str. 35.
U prvom dijelu tabele su prezentirani decilni omjeri kao relativni pokazatelji potrošnje po stanovniku. Relativni interdecilni omjer D9/D1 izmedu 10% najbogatije i 10% najsiromašnije proporcije stanovništva prema potrošnji pokazuje da je potrošnja osobe koja se nalazi na početku desetog dijela bila za 3,29 puta veća od potrošnje osobe koja se nalazi u gornjem dijelu prvih 10% stanovništva. Ili, globalno, potrošnja 10% najbogatijih je bila za 3,29 puta veća od potrošnje 10% najsiromašnijih. Predstavljeni su i interdecilni omjeri: D5/D1 označen kao omjer od srednje bogatih ka siromašnim, kao i odnos D9/D5 kao omjer bogatih prema srednje bogatim. Relativni odnosi D9/D1 i D5/D1 ukazuju na veću nejednakost u entitetu RS u odnosu na FBiH, dok je u slučaju interdecilnog omjera D9/D5 nejednakost više izražena u FBiH.
94
Poglavlje 2. – Analiza i sinteza podataka
U drugom dijelu tabele su prezentovani kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji proporcija od po 20% stanovništva rangiranih od najsiromašnijih do najbogatijih. U BiH udio 20% najsiromašnijih u ukupnoj potrošnji je 9,5% a 20% najbogatijih čak 35,8% što ukazuje na značajnu nejednakost u raspodjeli ukupne potrošnje. Proporcije po entitetima su približno istog reda vrijednosti. Vrijednost Ginijevog indeksa je 0,26 što ukazuje na značajan nivo koncentracije potrošnje, odnosno na nejednakost u raspodjeli ukupne potrošnje u BiH i entitetima. Ginijev indeks prilagođen OECD skali je još niži i iznosi 0,24. % 100 90 80 70
Lorenzova kriva za BiH potpuna jednakost
60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100
Grafikon 2.18.
%
Lorenzova kriva potrošnje per capita u BiH za 2001. godinu
2.7.3. Medijala Medijala je vrijednost varijable pridružena relativnoj kumulativnoj rastućoj globalnoj vrijednosti od 50%. Postupak za određivanje medijale je sljedeći: •
izračunati globalne vrijednosti f j ⋅ x j
95
Statistika u ekonomiji i menadžmentu
•
izračunati relativne globalne vrijednosti q j = f j ⋅ x j / ∑ f j ⋅ x j
•
izračunati relativne kumulativne rastuće frekvencije globalne vrijednosti Qj odrediti medijalnu klasu izračunati vrijednost medijale korištenjem sljedećeg izraza
• •
Mle =
( xi − xi −1 ) ⋅[0,50 − Q( xi −1 )] Q( xi ) − Q( xi −1 )
+ xi −1
(2.101)
Odstupanje između medijale i medijane je pokazatelj koncentracije:
δM = Ml − Me e
(2.102)
Veća vrijednost ovog pokazatelja predstavlja veću koncentraciju i veću nejednakost u raspodjeli.
2.8. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
96
Definišite pojam statistike. Navedite etape statističkog istraživanja. Navedite sinonime za statistički skup i statističku varijablu. Definišite statističku varijablu. Definišite i analizirajte četiri osnovna tipa mjernih skala i njihove osobine. Definišite nominalnu mjernu skalu i njene karakteristike. Definišite statističku kvalitativnu varijablu i analizirajte njene tipove i karakteristike. Analizirajte vrste kvantitativnih statističkih varijabli i njihove osobine. Uporedite i komentirajte negrupisanu statističku seriju, uređenu statističku seriju i statističku distribuciju frekvencija. Koje vrste frekvencija poznajete? Definišite ih i napišite formule za njihovo izračunavanje. Definišite rastuću kumulativnu frekvenciju. Nabrojite parametre centralne tendencije. Definišite medijanu i analizirajte njene osobine. Definišite mod. Definišite aritmetičku sredinu i analizirajte njene osobine. Koja je proporcija elemenata date serije koji se nalaze između Q1 i medijane?
Poglavlje 2. – Analiza i sinteza podataka
16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36.
Koja je proporcija elemenata date serije koji se nalaze između Q1 i Q3? Koja je proporcija elemenata date serije koji se nalaze između D1 i D9? Koja je proporcija elemenata date serije koji se nalaze iznad C99? Definišite geometrijsku sredinu. Definišite harmonijsku sredinu. Nabrojite parametre disperzije. Definišite interkvartilno apsolutno odstupanje. Navedite karakteristike prosječnog apsolutnog odstupanja. Definišite i analizirajte detaljno osobine i ekonomsko značenje standardne devijacije i varijanse. Objasnite četiri etape u konstrukciji varijanse. Napišite formule za varijansu i standardnu devijaciju i objasnite njihove prednosti i nedostatke u odnosu na ostale parametre disperzije. U kojim jedinicama mjere je izražena standardna devijacija i da li je možemo koristiti za poređenje serija izraženih u različitim jedinicama mjere? Definišite koeficijent varijacije i njegove karakteristike. Navedite teoremu koja omogućuje istovremeno tumačenje aritmetičke sredine i standardne devijacije. Koje informacije pruža Box-plot? Koje tipove asimetrije poznajete i kako ih možete analizirati? Analizirajte mjere zaobljenosti. Definišite mjere koncentracije. Objasnite konstrukciju i značenje Lorenzove krive. Definišite Ginijev koeficijent. Ako su vrijednosti Ginijevog koeficijenta 0,2 i 0,8 objasnite njihovo značenje
97
Statistika u ekonomiji i menadžmentu
2.9. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA Zadatak 1. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Koje su vrste varijabli pomoću kojih možemo mjeriti: Godine jedne osobe: kvantitativna diskretna Cijenu hljeba: kvantitativna (diskretna ili kontinuirana) ili kvalitativna ordinalna Temperaturu u amfiteatru: kvantitativna (intervalna skala) Ljubaznost jedne osobe: kvalitativna ordinalna Boju očiju vaše djevojke: kvalitativna nominalna Jačinu tona: kvantitativna Inteligenciju jedne osobe: kvalitativna ordinalna ili kvantitativna ako je izražena preko koeficijenta inteligencije Stručnu spremu zaposlenih na zaposlenih na fakultetu: kvalitativna ordinalna Nivo razvijenosti jedne zemlje: kvalitativna ordinalna Težinu studenata: kvantitativna kontinuirana Visinu studentica: kvantitativna kontinuirana Razumijevanje ovog pitanja: kvalitativna ordinalna
Zadatak 2. Ispit iz predmeta Ekonometrija je bio sastavljen od 6 pitanja. Poslije ispravke 100 radova, nastavnik je evidentirao broj tačnih odgovora svakog studenta u sljedećoj tabeli: 3 5 2 1 4
6 1 3 3 3
5 1 4 2 1
2 2 1 5 4
3 5 1 2 6
3 4 4 4 1
3 6 2 6 2
4 0 3 3 3
5 4 1 1 1
4 1 5 2 6
2 4 2 4 1
3 6 3 5 4
2 2 1 2 5
2 4 3 4 2
2 5 3 6 2
4 1 5 1 6
5 3 2 2 1
5 3 2 3 3
6 3 2 1 3
2 1 1 1 2
1. Definišite populaciju, elemente populacije i posmatranu varijablu. Koji je tip posmatrane varijable? 2. Koja je veličina populacije? Koji su modaliteti posmatrane varijable? 3. Kompletirajte statističku distribuciju. 4. Predstavite grafički ovu distribuciju. 5. Komentarišite uspjeh studenata na ovom ispitu. Koji je prosječan broj tačnih odgovora? Odredite mod i medijanu. 98
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 1. i 2. Populacija: radovi studenata, element populacije: rad studenta, varijabla: kvantitativna diskretna tačan broj odgovora ima 7 modaliteta, veličina populacije 100 radova studenata. 3. Modaliteti xj
Apsolutna frekvencija fj 1 20 23 20 15 12 9 100
0 1 2 3 4 5 6 -
Relativna frekvencija pj 0,01 0,20 0,23 0,20 0,15 0,12 0,09 1,00
Relativna rastuća kumulativna frekvencija Fj 0,01 0,21 0,44 0,64 0,79 0,91 1,00 -
4. 25
Broj studenata
20 15 10 5 0
0
Grafikon 2.19.
1
2 3 4 Broj tacnih odgovora
5
6
Ispitni rezultati
5. Prosječan broj tačnih odgovora je 3. Mod je jednak 2. Medijana je jednaka 3. 99
Statistika u ekonomiji i menadžmentu
Zadatak 3. Među osobama koje su se vjenčale u junu 2002 godine, 10 osoba je jedinac/jedinica, 16 osoba ima jednog brata ili sestru, 7 osoba ima 2 brata ili sestre, 3 osobe imaju 3 brata ili sestre, 3 osobe 4 brata ili sestre, nijedna osoba nema 5 braće ili sestara i jedna osoba ima 6 braće ili sestara. 1. Odredite posmatranu populaciju i njenu veličinu. 2. Koja je posmatrana varijabla, njen tip i modaliteti ? 3. Kompletirajte statističku distribuciju i grafički je predstavite. 4. Izračunajte mod, medijan i aritmetičku sredinu. Elementi rješenja: 3. Varijabla
Broj braće i sestara (xj) 0 1 2 3 4 5 6 Ukupno
100
Kumulativna Apsolutna apsolutna frekvencija frekvencija
Relativna frekvencija
Relativna rastuća kumulativna frekvencija
fj
Sj
pj
Fj
10 16 7 3 3 0 1 40
10 26 33 36 39 39 40
0,25 0,4 0,175 0,075 0,075 0 0,025 1
0,25 0,65 0,825 0,9 0,975 0,975 1
Poglavlje 2. – Analiza i sinteza podataka
Apsolutna frekvencija
20 16 15 10
10 7
5 0
3
3 0
0
1
2
3
4
5
1 6
Broj brace i sestara Grafikon 2.20.
Dijagram sa stupcima za varijablu broj brace i sestara
4. Parametri centralne tendencije • Mod: 1 brat ili sestra • Medijana: 1 brat ili sestra • Aritmetička sredina: 1,425
Zadatak 4. Za svaku od sljedećih distribucija kompletirajte intervale i izračunajte centre svakog intervala. Prečnik u mm:
Godine starosti:
Težina u kg:
140-145 145-150
0- 5 godina 6-10 godina
manje od 70 70 i manje od 75
150-155 155-160
11-15 godina 16-20 godina
75 i manje od 80 80 i manje od 85
160-165 165-170
21-25 godina 26-30 godina
85 i manje od 90 90 i manje od 100 više od 100
Komentirajte kompletirane distribucije. 101
Statistika u ekonomiji i menadžmentu
Elementi rješenja: Prečnik u mm: xj
[140-145[ [145-150[ [150-155[ [155-160[ [160-165[ [165-170]
Centar xc 142,5 147,5 152,5 157,5 162,5 167,5
Godine starosti: xj
Centar xc 2,75 8 13 18 23 28
[0-5,5[ [5,5-10,5[ [10,5-15,5[ [15,5-20,5[ [20,5-25,5[ [25,5-30,5]
Težina u kg: xj
[0-70[ [70-75[ [75-80[ [80-85[ [85-90[ [90-100[ [100;+∞]
Centar xc 35 72,5 77,5 82,5 87,5 95 -
U trećoj distribuciji zadnji interval nema centra i zbog toga trebate biti vrlo oprezni u tumačenju rezultata. Zadatak 5. Kompletirajte sljedeću tabelu: Klase xj
Centri xc
[10;20[ [20;30[ [30;40[ [40;60[ [60;80]
Rastuća kumulativna relativna frekvencija Fj
pj
Korigovana relativna frekvencija pj/aj
0,08 0,21 0,55 0,86
Elementi rješenja: Klase
Amplituda aj
Centri xc
pj
Fj
[10;20[ [20;30[ [30;40[ [40;60[ [60;80]
10 10 10 20 20
15 25 35 50 70
0,08 0,21 0,26 0,31 0,14
0,08 0,29 0,55 0,86 1,00
102
Korigovana relativna frekvencija pj/aj 0,008 0,021 0,026 0,015 0,007
Poglavlje 2. – Analiza i sinteza podataka
Zadatak 6. Na osnovu statističkog istraživanja jedne populacije izvršeno je grupisanje elemenata populacije u intervale čiji su centri sljedeći: 52, 60, 68, 76, 84, 92. 1. Koja je amplituda posmatranih intervala? 2. Izračunajte gornju i donju granicu svakog intervala i kompletirajte tako grupisanu distribuciju. Elementi rješenja: 1. Amplituda svake klase je 8. 2. [48;56[, ..........., [88;96[ Zadatak 7. 50 studenata je odgovaralo na test koji se sastojao od 20 pitanja. Sljedeća serija je kompletirana na osnovu broja tačnih odgovora: 10 11 7 11 11
8 11 11 7 19
3 8 10 8 9
12 5 10 10 4
13 13 2 13 10
9 14 15 9 8
12 14 12 13 9
9 6 10 9 6
12 12 1 7 7
11 16 14 13 14
1. Predstavite rezultate u obliku distribucije frekvencija grupisane u intervale tako da prvi i posljednji interval imaju amplitudu 5 a ostale klase amplitudu 2. 2. Izračunajte relativne frekvencije. 3. Izračunajte kumulativne relativne frekvencije. 4. Koja je proporcija studenata čiji je broj tačnih odgovora bio manji od 9? 5. Koja je proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13? 6. Koja je proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20? 7. U kojem intervalu je gustoća najmanja, a u kojoj najveća? 8. Konstruišite odgovarajuću grafičku prezentaciju analizirane distribucije.
103
Statistika u ekonomiji i menadžmentu
Elementi rješenja: U tabeli odgovori 1.,2.,3. Intervali xj
fj
pj
Fj
[0;5[ [5;7[ [7;9[ [9;11[ [11;13[ [13;15[ [15;20] Ukupno
4 3 8 12 11 9 3 50
0,08 0,06 0,16 0,24 0,22 0,18 0,06 1,00
0,08 0,14 0,30 0,54 0,76 0,94 1,00 -
Korigovana frekvencija (gustoća) pj / aj 0,8 1,5 4,0 6,0 5,5 4,5 0,6 -
4. Proporcija studenata čiji je broj tačnih odgovora bio manji od 9 je 30%. 5. Proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13 je 24%. 6. Proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20 je 92%. 7. Najmanja gustoća 0,6 je u intervalu [15;20[, a najveća u intervalu [9;11[ i iznosi 6,0. 8. Grafička prezentacija analizirane distribucije je histogram koji je potrebno konstruisati na osnovu podataka kolone korigovana frekvencija. Zadatak 8. U sljedećoj statističkoj seriji je predstavljen broj sati koje je 13 studenata posvetilo pripremi testa iz Statistike: 5
6
2
7
11
9
3
4
9
8
7
3
7
1. Odredite aritmetičku sredinu. 2. Odredite medijanu i njenu kumulativnu frekvenciju. Komentarišite dobijeni rezultat. 3. Odredite mod. 104
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 1. Aritmetička sredina jednaka je 6,23. 2. Uređena serija po rastućem redu podataka: 2 3 3 4 5 6 7 7 7 8 9 9 11 Broj podataka je neparan i medijana je jednaka:
Me = x
(
n +1 ) 2
= x 13+1 = x ( 7 ) = 7 (
2
)
Kumulativna frekvencija je jednaka: F j =
xj fj Sj
2 1 1
3 2 3
4 1 4
5 1 5
6 1 6
7 3 9
Sj N
=
8 1 10
9 = 0,6923 ⇒ 69,23% 13 9 2 12
11 1 13
Ukupno 13
3. Mod je jednak 7. Zadatak 9. Dati su sljedeći podaci o distribuciji zaposlenih prema godišnjoj plati u eurima: Prosječna plata 12 090 eura Medijanska plata 11 175 eura Standardna devijacija 4 600 eura Ginijev koeficijent 0,20 Plate variraju u intervalu od 8 400 do 30 500 eura. Kako će se mijenjati navedeni parametri uz sljedeće pretpostavke: 1. Sve plate su povećane za 200 eura. 2. Za 150 eura su povećane samo plate manje od 9 050 eura. 3. Za 10% su smanjene plate veće od 22 870 eura. 4. Sve plate su povećane za 10%. 5. Za svaki odgovor dajte neophodna objašnjenja. Elementi rješenja: 1. Ako su sve plate povećane za 200 eura, ukupni platni fond (masa plata) se povećava. Prosječna plata i medijana se povećaju za 200 eura. 105
Statistika u ekonomiji i menadžmentu
Standardna devijacija ostaje nepromijenjena. Ginijev koeficijent se smanjuje. Plate variraju u intervalu (8600; 30700) eura. 2. Ako se za 150 eura povećaju samo plate manje od 9 050, eura ukupna masa plata i prosječna plata se povećavaju. Pošto nijedna povećana plata nije veća od medijane, medijana ostaje nepromijenjena. Disperzija se smanjuje jer se povećane plate približavaju prosječnoj plati. Ginijev indeks se smanjuje. Plate variraju u intervalu (8 550; 30 500) eura. 3. Ako su za 10% smanjene plate veće od 22 870, eura masa plata i prosječna plata se smanjuju. Medijana se ne mijenja jer je 22 870 veće od 11 175 eura. Disperzija se smanjuje jer se smanjene plate približavaju prosječnoj plati. Standardna devijacija se smanjuje. Nejednakost u raspodijeli mase plata se smanjuje i Ginijev koeficijent također se smanjuje. Plate variraju u intervalu (8 400; 27 450) eura. 4. Ako se sve plate povećaju za 10%, prosječna plata, medijana, i standardna devijacija se povećavaju za 10%. Ginijev koeficijent se ne mijenja. Raspon plata se povećava i plate variraju u intervalu (9 240; 33 550) eura. Zadatak 10. Poznata je sljedeća distribucija godišnjih plata u jednom preduzeću: Godišnje plate xi u KM
[5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno
Broj zaposlenih (fj) 60 80 105 110 35 10 400
Frekvencija (pj) u% 15,00 20,00 26,25 27,50 8,75 2,50 100,00
1. Nacrtajte kumulativnu krivu. 2. Pomoću kumulativne krive procijenite grafički, a zatim odredite analitički vrijednosti kvartila. 3. Nacrtajte box- plot i komentarišite karakteristike distribucije. 4. Odredite prosječnu platu, standardnu devijaciju i koeficijent varijacije. Objasnite dobijene rezultate. 5. Kompletirajte sljedeću tabelu: 106
Poglavlje 2. – Analiza i sinteza podataka Godišnje plate xi u KM
Broj zaposlenih
Frekvencija
(fj)
u%
(pj)
Kumulativna frekvencija
(Fj)
Centar intervala
Masa plata (agregat)
xcj
fj .xcj
qj u%
u% [5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno
60 80 105 110 35 10 400
15,00 20,00 26,25 27,50 8,75 2,50 100,00
15 35 61,25 88,75 97,5 100 -
Relativni Agregat
6 000 7 000 8 500 10 000 13 000 17 500
360 000 600 000 892 500 1 100 000 455 000 175 000 3 582 500
10,0 16,7 24,9 30,7 12,7 4,9 100,0
Relativni kumulativni agregat
Qj u% 10,0 26,8 51,7 82,4 95,1 100,0
6. Konstruišite Lorenzovu krivu. 7. Izračunajte Ginijev koeficijent. 8. Koji bi bio oblik Lorenzove krive ako bi svih 400 zaposlenih imali jednaku platu? 9. Koji bi bio oblik Lorenzove krive ako 399 zaposlenih ne bi primali platu, a 1 zaposleni (šef) primio 3 582 500 KM? 10. Koji je vaš zaključak o disperziji i koncentraciji analizirane distribucije plata? Elementi rješenja: 2. F(Q1)=0,25 interval kojem pripada prvi kvartil je 7000-8000 i primjenom formule na bazi kumulativnih frekvencija dobijamo: Q1=7500; Q2=Me=8571,42≈8571; Q3=10 000 4. Prosječna plata (aritmetička sredina) je jednaka približno 8956 KM; standardna devijacija 2312 KM i koeficijent varijacije 0,26%. 5. Tabela kompletirana na početku. 7. Ginijev koeficijent G = 1 − ∑ f j (Q j −1 + Q j ) G = 1−
1 104
∑f
j
(Q j −1 + Q j )
107
Statistika u ekonomiji i menadžmentu
⎡15(0 + 10, 05) + 20(10, 05 + 26,8) + 26, 25(26,8 + 51, 71) + ⎤ ⎢ +27,5(51, 71 + 82, 41) + 8, 75(82, 41 + 95,11) + 2,5(95,11 + 100) ⎥ ⎣ ⎦
G = 1−
1 104
G = 1−
1 ⋅ 8678 = 0,132 104
8. Lorenzova kriva bi se podudarala sa dijagonalom (linijom jednake raspodjele) i koncentracija bi bila jednaka nuli, dakle raspodjela bi bila savršeno ravnomjerna. 9. Lorenzova kriva bi se podudarala sa katetama trougla ispod dijagonale, koncentracija bi bila jednaka jedinici i postojala bi savršena nejednakost u raspodjeli. 10. Distribucija mase plata (globalne vrijednosti) je relativno ravnomjerno raspodijeljena. Disperzija plata nije previše izražena. Plate su uglavnom koncentrisane u sredini serije. Zadatak 11. U sljedećoj tabeli su predstavljeni podaci koji se odnose na koncentraciju prihoda domaćinstava u regionu X u 2005. godini. Broj grupe Grupa 1 Grupa 2 Grupa 3
Fj u % 25 50 75
Prihod u KM 45 046 267 274 628 832
Qj u % 0,82 6,04 25,64
1. Koji je statistički termin za podatke predstavljene u trećoj koloni? 2. Konstruišite kumulativnu krivu uz pretpostavku da je maksimalan prihod domaćinstva 1 milion KM. Nacrtajte box-plot i komentirajte dobijene rezultate. 3. Nacrtajte Lorenzovu krivu. Komentarišite. 4. Izračunajte Ginijev koeficijent i objasnite ga. Uporedite vaš odgovor sa komentarom datim pod tačkom 3.
108
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 4.
1 ∑ f j (Q j −1 + Q j ) = 1 − 104 − [ 25(0 + 0,82) + 25(0,82 + 6, 04) + 25(6, 04 + 25, 64) + 25(25, 64 + 100) ]
G = 1−
= 1−
1 ⋅ 4276 = 1 − 0, 4276 = 0,5724 104
Postoji jaka koncentracija mase prihoda domaćinstava u regionu X u 2005.g. Zadatak 12. Data je sljedeća distribucija plata: Iznos u novčanim jedinicama xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno
Frekvencija fj 410 637 785 724 2556
1. Kompletirati sljedeći tabelu: xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno
2. 3. 4. 5. 6.
fj 410 637 785 724 2556
pj u %
Fj u %
16,04 24,92 30,71 28,33 100
16,04 40,96 71,67 100
xc
xc ⋅ fj
qj u % Qj u %
7 500 3 075 000 3,69 15 000 9 555 000 11,48 30 000 23 550 000 28,29 65 000 47 060 000 56,54 83 240 000 100,00
3,69 15,17 43,46 100,00
Odredite medijanu polazeći od kumulativnih frekvencija Izračunajte Ginijev koeficijent i komentarišite dobijeni rezultat. Konstruišite Lorenzovu krivu i dajte vaš komentar. Izračunajte medijalu. Izračunajte odstupanje medijala-medijana. 109
Statistika u ekonomiji i menadžmentu
Elementi rješenja: 1. 2. 3. 4.
Tabela kompletirana. Me=25 885,35 G=0,3606 Lorenzova kriva pokazuje veliku nejednakost u raspodjeli ukupne mase plata. 5. Medijala: 45 783,52 6. Odstupanje medijala-medijana: 45 783,52-25 885,35=19 898,17
110
POGLAVLJE 3.
REGRESIONA I KORELACIONA ANALIZA
U dosadašnjim poglavljima smo analizirali i istraživali populaciju u odnosu na samo jednu varijablu. Međutim, vrlo često se dešava da se statistička istraživanja jedne populacije baziraju simultano na dvije ili više kvantitativnih varijabli. Pitanje koje se postavlja u ovom slučaju je traženje i određivanje eventualne veze između ovih varijabli. U prvom dijelu ovog poglavlja ćemo analizirati modelizaciju veza između dvije ili više varijabli, a zatim metode kvantifikacije veza i njihovu primjenu. Drugi dio poglavlja obrađuje mjere reprezentativnosti i kvaliteta ocijenjenih modela.
3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI Da bismo pristupili modelizaciji veza između dvije ili više varijabli polazimo od sljedećih pretpostavki: 1. Modeliziranje možemo vršiti ukoliko postoji zavisnost između varijabli. 2. Mogu se modelizirati jedino kvantitativne varijable, jer je u tom slučaju moguće kompletirati oblak (dijagram) rasipanja, računati mjere centralne tendencije i disperzije. 111
Statistika u ekonomiji i menadžmentu
3.1.1. Etape konstrukcije modela Model je pojednostavljena slika realnosti i služi da bismo na pogodan način kvantificirali složene ekonomske fenomene. Etape konstrukcije i ocjene jednog modela su sljedeće: • Odabrati nezavisnu i zavisnu varijablu • Grafički predstaviti na dijagramu rasipanja posmatrane podatke da bi se potvrdila ili odbacila pretpostavka o zavisnosti 2 statističke varijable. • Na osnovu dijagrama procijeniti oblik veze između posmatranih varijabli i konstruisati odgovarajući model. Postoje različiti oblici veza kao npr. linearna, krivolinijska, eksponencijalna itd. • Ocijeniti primjenom odgovarajućih metoda odabrani model. • Izračunati rezidualna (neobjašnjena) odstupanja ocijenjenih od posmatranih podataka i analizirati ih. • Procijeniti kvalitet ocijenjenog modela. 3.1.1.1. Dijagram (oblak) rasipanja Postoje različiti oblici zavisnosti varijabli. Neke od njih smo predstavili na sljedećem grafikonu. Y
Y
a
112
X
Y
d Grafikon 3.1.
b
X
Y
Y
X
c
X
f
X
Y
e
X
Razliciti oblici veza izmedu dvije varijable – dijagram rasipanja
Poglavlje 3. – Regresiona i korelaciona analiza
U slučajevima a i b veze su linearne. U slučaju a, sa rastom nezavisne dolazi do rasta zavisne varijable. U slučaju b, rast nezavisne varijable uzrokuje opadanje zavisne varijable. U slučaju c ne bismo mogli utvrditi postojanje veze jer povećanje nezavisne varijable ne mijenja zavisnu varijablu. U slučajevima d, e i f postoje krivolinijske veze između nezavisne i zavisne varijable. Smjer njihovih promjena je isti u slučaju d, a suprotan u slučaju f. Dijagram rasipanja pruža polaznu informaciji o obliku zavisnosti između dvije varijable.
3.2. KOVARIJANSA Kovarijansa mjeri uzajamnu varijabilnost dvije varijable u odnosu na njihove respektivne aritmetičke sredine: Cov( X , Y ) =
1 n ∑ ( xi − x ) ⋅ ( yi − y ) . n i =1
(3.1)
Kovarijansa nam omogućava da utvrdimo da li postoji simultana varijacija između vrijednosti varijabli X i Y u odnosu na odabranu tačku čije su koordinate aritmetičke sredine varijabli X i Y.b Razvijena formula kovarijanse omogućava jednostavnije izražavanje varijanse: Cov( X , Y ) =
1 ∑ ( xi − x ) ⋅ ( yi − y ) n i
=
1 ∑ ( xi yi − xi y − xyi + x ⋅ y ) n i
=
1 1 1 xi yi − y ∑ xi − x ∑ yi + x ⋅ y ∑ n i n i n i
=
1 ∑ xi yi − y ⋅ x − x ⋅ y + x ⋅ y n i
Cov( X , Y ) =
1 n ∑ xi yi − x ⋅ y n i =1
(3.2)
Cov( X , Y ) = xy − x ⋅ y
113
Statistika u ekonomiji i menadžmentu
Na osnovu gornje relacije možemo zaključiti da je kovarijansa jednaka razlici između aritmetičke sredine proizvoda i proizvoda aritmetičkih sredina varijabli X i Y. Kovarijansa varijable X sa varijablom X (sa samom sobom) predstavlja generaliziranu formulu varijanse:lnih zavisnosti
Cov( X , X ) =
1 n 1 n 2 x − x x − x = ( )( ) ( xi − x ) = σ X2 ∑ ∑ i i n i =1 n i =1
(3.3)
Kovarijansa je pozitivna ako oblak rasipanja ima generalno rastuću tendenciju. Kovarijansa je negativna kada oblak rasipanja ima generalno opadajuću tendenciju. Kovarijansa je jednaka ili približno jednaka nuli ako oblak rasipanja nije ni rastući ni opadajući ili ukoliko je pola opadajući, a pola rastući. Kada X i Y variraju u istom smjeru, kovarijansa je pozitivna. Kada X i Y variraju u suprotnom smjeru, kovarijansa je negativna. Ako nema ni rastuće ni opadajuće generalne tendencije, kovarijansa je jednaka nuli. Na sljedećem primjeru ćemo ilustrovati kompletiranje oblaka rasipanja i izračunavanje kovarijanse. Primjer 3.1. Tabela 3.1. Prihod preduzeća izražen u hiljadama KM (Y) i proizvodnja izražena u kilogramima (X)k
xi
zyi
50 100 150 200 250 300 350
20 25 25 35 30 35 40
U ovom slučaju prihod preduzeća Y je zavisna varijabla, a proizvodnja izražena u kilogramima nezavisna varijabla. Mi ćemo posmatrati prihod u funkciji ostvarene proizvodnje i konstruisati dijagram rasipanja.
114
Poglavlje 3. – Regresiona i korelaciona analiza
Prihod u 000 KM
50 40 30 20 10 0
0
50
100
Grafikon 3.2.
150 200 250 Proizvodnja u kg
300
350
400
Dijagram rasipanja
Na osnovu dijagrama rasipanja konstatujemo da postoji linearna veza između dvije posmatrane varijable. Da bismo potvrdili ovu konstataciju, izračunat ćemo vrijednost kovarijanse. Tabela 3.2. Radna tabela za računanje kovarijanse
Σ
xi
yi
( xi − x )
( yi − y )
( xi − x )( yi − y )
( xi − x ) 2
50 100 150 200 250 300 350 1400
20 25 25 35 30 35 40 210
-150 -100 -50 0 50 100 150 0
-10 -5 -5 5 0 5 10 0
1500 500 250 0 0 500 1500 4250
22500 10000 2500 0 2500 10000 22500 70000
Aritmetička sredina varijabli X i Y je x = 200 ; y = 30 . Na osnovu podataka iz tabele izračunali smo kovarijansu: Cov( X , Y ) =
1 n
n
1
∑ ( x − x ) ( y − y ) = 7 ⋅ 4250 = 607,14 i
i
i =1
115
Statistika u ekonomiji i menadžmentu
Visoka vrijednost kovarijanse potvrđuje već konstatovanu činjenicu uzajamne varijabilnosti varijabli X i Y. •
Zbir i razlika statističkih varijabli
Koristeći kovarijansu možemo analizirati varijansu zbira i razlike statističkih varijabli i izraziti ih na sljedeći način:. Var(X+Y)=VarX + Var Y+ 2 Cov(X,Y)
(3.4)
Var(X-Y)=VarX + Var Y- 2 Cov(X,Y)
(3.5)
Ako su X i Y nezavisne, kovarijansa je jednala nuli (Cov(X, Y)=0). U tom slučaju zbir i razlika statističkih varijabli se mogu izraziti sljedećim relacijama: Var(X+Y)=VarX + Var Y
(3.6)
Var(X-Y)=VarX + Var Y
(3.7)
3.3. REGRESIONA ANALIZA Kada se pomoću statističkih metoda istražuje jedna pojava nezavisno od ostalih, radi se o jednodimenzionalnoj statističkoj analizi. Statističkim metodama možemo analizirati i međusobne odnose više pojava. U tom slučaju se radi o višedimenzionalnoj analizi. Ovim metodama ne analiziramo uzroke ni posljedice pojava, već zavisnost pojava i njihovih promjena. Veze među pojavama, kao što smo već istakli, mogu biti funkcionalne i stohastičke. Statistička analiza odnosa između dvije ili više pojava se vrši metodama deskriptivne i inferencijalne statistike. Stepen statističke povezanosti između pojava se istražuje metodama korelacione analize. Za određivanje analitičkog odnosa među pojavama primjenjuju se regresioni modeli. Veza među pojavama je funkcionalna ako su vrijednostima jedne pojave u potpunosti određene vrijednosti druge pojave. U tom slučaju za svaku vrijednost nezavisne varijable možemo precizno odrediti vrijednosti zavisne varijable. Funkcionalne veze najčešće susrećemo u prirodnim naukama i u manjoj mjeri u društvenim naukama. Kada jednoj vrijednosti nezavisno promjenljive X odgovara više vrijednosti zavisno promjenljive Y kažemo da je njihova veza stohastička. Npr. veza između potrošnje i dohotka domaćinstava. Opšti oblik regresionog modela je sljedeći: 116
Poglavlje 3. – Regresiona i korelaciona analiza
Y = f ( X 1 , X 2 ,...., X K ) + e
(3.8)
gdje je Y zavisna promjenljiva, X su nezavisne promjenljive i parametar e slučajno odstupanje. Model (3.8.) se naziva model višestruke regresije ili višedimenzionalni regresioni model. Model koji sadrži zavisnu i jednu nezavisnu promjenljivu naziva se model jednostavne regresije ili jednodimenzionalni regresioni model. Model jednostavne regresije ima sljedeći oblik:
Y = f (X ) + e
(3.9)
Zadatak regresione analize je istraživanje analitičkog oblika veze između pojava kojem se najviše približavaju promjene analiziranih pojava. Zadatak korelacione analize je utvrđivanje stepena i smjera povezanosti pojava. 3.3.1. Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavimo da je veza zavisne varijable Y i nezavisne varijable X linearna. Y je varijabla koju treba objasniti pomoću varijable X. Polazni model linearne regresije za skup od n vrijednosti (xi, yi) varijabli X i Y se može napisati u sljedećem obliku:
y i = a + bxi + ei , i = 1,2,..., n.
(3.10)
Označimo sa
yˆ i = a + bxi
(3.11)
funkcionalni dio modela gdje su a i b parametri koje treba ocijeniti. Podaci su dati kao n posmatranih parova (xi, yi), a yˆi predstavlja ocijenjene vrijednosti Y na osnovu posmatranih vrijednosti xi od X. Na osnovu izraza (3.9.) i (3.10) možemo napisati relaciju
yi = yˆ i + ei
(3.12)
iz koje možemo izraziti slučajno ili rezidualno odstupanje ei kao razliku između posmatranih i ocijenjenih vrijednosti varijable Y:
e i = yi − yˆ i e i = yi − a − bxi
(3.13)
117
Statistika u ekonomiji i menadžmentu
Slučajno odstupanje smo predstavili na sljedećem grafikonu. y
yˆ i = a + bxi
yi ei = yi − yˆ i
yˆ i
xi Grafikon 3.3.
x
Rezidualna odstupanja
Cilj je primijeniti metod za ocjenu parametara regresionog modela koji će minimizirati rezidualna odstupanja. Pitanje koje se postavlja je izbor kriterija koji će obezbijediti minimizaciju slučajnih odstupanja. Jedan od kriterija bi mogao biti zbir rezidualnih odstupanja jednak nuli:
∑ ei = ∑ ( yi − yˆi ) = 0 i
i
Sve prave koje prolaze kroz tačku gravitacije G ( x , y ) zadovoljavaju ovaj kriterij jer se pozitivna i negativna rezidualna odstupanja anuliraju. Zbog toga ovaj kriterij ne može poslužiti za izbor najbolje regresione prave. Kriterij koji nam omogućava izbor najbolje regresione prave je minimiziranje zbira kvadrata rezidualnih odstupanja:
minimum
∑ ei2
(3.14)
i
Na ovom kriteriju je baziran metod najmanjih kvadrata. Minimiziranje zbira kvadrata rezidualnih odstupanja: n
n
n
i =1
i =1
i =1
∑ ei2 = ∑ ( y i −yˆ i ) 2 = ∑ ( y i −a − bxi ) 2 118
(3.15)
Poglavlje 3. – Regresiona i korelaciona analiza
je moguće uz potrebne uslove koji zahtijevaju da parcijalni izvodi ovog zbira po parametrima a i b budu jednaki nuli: n
∂ ∑ ei2 i =1
∂a
n
= 2∑ ( y i −a − bx i )(−1) = 0
(3.16)
i =1
n
∂ ∑ ei2 i =1
∂b
n
= 2∑ ( y i −a − bx i )(− x i ) = 0
(3.17)
i =1
Iz ovih uslova slijedi sistem normalnih jednačina n
n
i =1
i =1
∑ y i = na + b∑ xi
(3.18)
n
n
n
i =1
i =1
i =1
∑ xi yi = a∑ xi + b∑ xi2
(3.19)
Rješavanjem ovog sistema normalnih jednačina dobijamo izraze za ocjenu parametara a i b: n
a=
∑y i =1
n
i
−b
n
∑x i =1
i
(3.20)
n
a = y − bx
(3.21)
Zamjenom ovog izraza u drugu normalnu jednačinu 3.19. dobijamo izraz za izračunavanje parametra b:
∑ x y = ( y − bx )∑ x + b∑ x ∑ x y = y ∑ x − bx ∑ x + b∑ x ∑ x y − y ∑ x = b(∑ x − x ∑ x ) ∑ x y − y∑ x b= ∑ x − x∑ x 2 i
i
i
i
i
i
i
i
2 i
i
i
i
2 i
i
i
i
2 i
i
(3.22)
i
119
Statistika u ekonomiji i menadžmentu
Parametar b možemo izraziti i u sljedećem obliku: n
b=
∑ x y − n⋅ x ⋅ y i
i =1
i
n
∑x i =1
2 i
− nx
(3.23)
2
odnosno
1 n ∑ xi yi − x ⋅ y n i =1 b= 1 n 2 xi − x 2 ∑ n i =1
(3.24)
Izraz u brojniku predstavlja razvijenu formulu kovarijanse Cov(X,Y), a izraz u nazivniku razvijenu formulu varijanse varijable X. Dakle, izraz za izračunavanje parametra b možemo napisati u sljedećem obliku:
b=
Cov( X , Y )
(3.25)
σ X2
3.3.2. Pretpostavke o osobinama stohastičnosti modela Regresioni model izražen regresionom pravom:
yi = a + bxi + ei , i = 1, 2,..., n.
(3.26)
je sastavljen iz dva dijela. Prvi dio modela (a+bxi) predstavlja funkcionalnu vezu pri kojoj je Y linearno zavisna od X ako su drugi faktori konstantni. Drugi, stohastički dio modela (ei), predstavlja slučajne varijacije, kojima se uzima u obzir djelovanje promjena drugih varijabli koje nisu eksplicitno uključene u model. Pod uslovom da specifikacija modela odgovara ekonomskoj relaciji u stvarnosti, i da bismo probleme mjerenja ekonomskih relacija preveli u probleme statističkog ocjenjivanja parametara rasporeda vjerovatnoće, neophodno je navesti pretpostavke o osobinama stohastičnosti linearnog regresionog modela:
120
a. E(ei) = 0,
(očekivana vrijednost greške je jednaka nuli)
b. E(ei2 ) = σ 2 ,
(konstantna zajednička varijansa)
Poglavlje 3. – Regresiona i korelaciona analiza
c. E(ei ej)= 0, 2
za svako i, j; i≠j; (nezavisnost)
d. ei: N(0, σ ),
(normalnost)
e. E(eiXj) = 0,
za sve i, j; (nezavisnost od Xj).
3.3.3. Aplikacija analiziranih metoda Na osnovu radne tabele 3.2. kompletirane na osnovu tabele 3.1. primjera 3.1. izračunavamo vrijednost parametara a i b i kompletiramo regresionu jednačinu: n 1 n x − x y − y ( ) ( ) ( xi − x ) ( yi − y ) i ∑ i ∑ Cov( X , Y ) n i =1 i =1 b= = = n Var ( X ) 1 n 2 x − x ( ) ( xi − x )2 i ∑ ∑ n i =1 i =1 b=
4250 = 0,061 70000
a = y − b ⋅ x = 30 − 0,061 ⋅ 200 = 17,857
yˆ = 17,857 + 0,061 ⋅ xi
Za ocjenu parametara regresione prave možemo koristiti statističke funkcije Excel-a. Rezultate dobijene primjenom ovog programa prezentujemo sljedećim tabelama i grafikonom. Tabela 3.3. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.1.
a. REGRESSION STATISTICS Multiple R 0,927426 R Square 0,860119 Adjusted R Square 0,832143 Standard Error 2,897043 Observations 7
121
Statistika u ekonomiji i menadžmentu
b. ANOVA SS MS 258,0357 258,0357 41,96429 8,392857 300
Regression Residual Total
df 1 5 6
Intercept X Variable 1
COEFFICIENTS 17,85714 0,060714
F 30,74468
Significance F 0,00262
STANDARD ERROR 2,448448 0,01095
T STAT 7,29325 5,544789
yˆ = 17,857 + 0,061x c. OBSERVATION 1 2 3 4 5 6 7
PREDICTED Y 20,89286 23,92857 26,96429 30 33,03571 36,07143 39,10714
RESIDUALS -0,89286 1,071429 -1,96429 5 -3,03571 -1,07143 0,892857
50
Prihod u 000 KM
40 30
yˆ = 0, 0607 x + 17, 857
20
R 2 = 0, 8601
10 0
0
Grafikon 3.4.
122
100
200 Proizvodnja u kg
300
Dijagram rasipanja i regresiona prava
400
Poglavlje 3. – Regresiona i korelaciona analiza
Koristeći navedeni program dobili smo ocjene vrijednosti parametara, jednačinu regresione prave, grafički prikaz i statističke parametre koji nam omogućuju analizu kvaliteta dobijene ocjene. Vrijednost parametra a je predstavljena kao odsječak na ordinatnoj osi. Vrijednost parametra b pokazuje za koliko jedinica se poveća prihod Y ako se proizvodnja X poveća za jedan kilogram. Primjenu navedenog programa ćemo ilustrovati i na sljedećem primjeru u kojem ćemo ocijeniti vezu između društvenog bruto proizvoda i prosječnog broja stanovnika. Posmatramo društveni bruto proizvod kao zavisnu i broj stanovnika kao nezavisnu ili eksplikativnu promjenljivu.
Primjer 3.2. Tabela 3.4. Društveni bruto proizvod (DBP) u milionima KM i prosječan broj stanovnika u 000 Godina
DBP u milionima KM
1996 1997 1998 1999 2000 2001
3049 6367 7244 8604 9611 10480
Prosječan broj stanovnika u hiljadama 3645 3756 3654 3752 3781 3798
DBP u milionima KM
12000 10000 8000 6000 4000 2000 0 3600
Grafikon 3.5.
3650
3700 3750 3800 prosječan broj stanovnika u 000
3850
Oblak rasipanja
123
Statistika u ekonomiji i menadžmentu
Dijagram rasipanja nam ukazuje na linearnu vezu između ove dvije promjenljive. Primjenom metode najmanjih kvadrata određujemo jednačinu regresione prave koja se najbolje prilagođava datim podacima. Ocijenjena regresiona prava zadovoljava uslov minimizacije kvadrata odstupanja ocijenjenih od posmatranih vrijednosti promjenljive Y. Tabela 3.5. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.2.
a. Intercept X Variable 1
COEFFICIENTS -115045 32,86094
STANDARD ERROR 45307,76 12,14204
yˆ = −115045 + 32,86 x b. REGRESSION STATISTICS Multiple R 0,804228 R Square 0,646783 Adjusted R Square 0,558479 Standard Error 1775,397 Observations 6
c. OBSERVATION 1 2 3 4 5 6
124
PREDICTED Y 4733,125 8380,69 5028,874 8249,247 9202,214 9760,85
RESIDUALS -1684,13 -2013,69 2215,126 354,7535 408,7861 719,15
Poglavlje 3. – Regresiona i korelaciona analiza
DBP u milionima KM
12000
yˆ = 32, 861 x − 115045
10000
R 2 = 0, 6468
8000 6000 4000 2000 0 3600
3650
3700
3750
3800
3850
Prosjecan broj stanovnika u 000 Grafikon 3.6.
Oblak rasipanja i linearna regresija
Reziduali 3000 2000 1000 0
3600
3650
3700
3750
3800
-1000 -2000 -3000
Grafikon 3.7.
varijabla
x
Dijagram rezidualnih odstupanja
Dobijene su pouzdane ocjene parametara. Na osnovu parametra b ocijenjene regresione jednačine konstatujemo da ako se broj stanovnika poveća za 1 000 društveni bruto proizod će se povećati za 32,86 miliona KM. Prava regresije metode najmanjih kvadrata prolazi kroz srednju tačku dijagrama čije su koordinate aritmetičke sredine analiziranih varijabli X i Y. Zadovoljavanje kriterija minimizacije kvadrata odstupanja podrazumijeva i zadovoljenje prvog kriterija, a to je da zbir rezidualnih odstupanja mora biti jednak nuli. 125
Statistika u ekonomiji i menadžmentu
∑ e = 0 ⇔ ∑ ( y − yˆ ) = 0 ⇔ ∑ y =∑ yˆ i
i
i
⇔
i
i
i
i
i
i
1 1 yi = ∑ yˆi ⇔ y = yˆ ∑ n i n i
(3.27)
Zbir rezidualnih odstupanja jednak nuli formalno znači da je aritmetička sredina posmatranih originalnih podataka jednaka aritmetičkoj sredini ocijenjenih podataka. 3.4. MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Da bismo ocijenili reprezentativnost i pouzdanost ocijenjenog modela potrebno je analizirati pokazatelje koji nam to omogućuju. Kao pokazatelje reprezentativnosti analizirat ćemo koeficijent determinacije, koeficijent korelacije, standardnu grešku i koeficijent varijacije regresionog modela. 3.4.1. Koeficijent determinacije Da bismo konstruisali koeficijent determinacije i objasnili njegovo značenje prezentirat ćemo grafički i formalizovati dekompoziciju varijanse. Dekompozicija varijanse promjenljive Y:
yi - y
y yi
yˆ i y
( x, y )
x G rafikon 3.8.
126
yˆ i = a + bx i
xi
Dekom pozicija varijanse
x
Poglavlje 3. – Regresiona i korelaciona analiza
Na osnovu grafikona 3.8. možemo izvršiti sljedeću formalizaciju. Ukupno odstupanje je jednako zbiru objašnjenog i neobjašnjenog odstupanja: ( yi − y ) = ( yˆi − y ) + ( yi − yˆi )
(3.28)
Kako je y = yˆ slijedi: ( yi − y ) = ( yˆi − yˆ ) + ( yi − yˆi )
(3.29)
što omogućava da pokažemo da je ukupna varijansa varijable Y jednaka zbiru objašnjene i neobjašnjene (rezidualne) varijanse:
(
1 1 2 ( yi − y ) = ∑ yˆi − yˆ ∑ n i n i
)
2
+
1 2 ( yi − yˆi ) ∑ n i
(3.30)
Ovaj izraz možemo napisati u sljedećem obliku:
∑( y i − y ) 2 ∑( yˆ i − y ) 2 ∑( y i − yˆ i ) 2 = + n n n
(3.31)
u kojem izraz na lijevoj strani predstavlja ukupnu varijansu, prvi član zbira na desnoj strani objašnjenu a drugi neobjašnjenu varijansu. Gornji izraz možemo napisati u dekomponovanoj formi uvodeći simbole za označavanje objašnjene i neobjašnjene varijanse:
∑( yi − y ) 2 n ∑( yˆi − y ) 2 Objašnjena varijansa : σ 2y / x = n Ukupna varijansa = σ y2 =
Rezidualna (neobjašnjena) varijansa: σ 2yˆ =
(3.32) (3.33)
∑( yi − yˆi ) 2 n
Ukupna varijansa : σ 2y = σ 2y / x + σ 2yˆ
(3.34) (3.35)
Koeficijent determinacije definišemo kao odnos objašnjene i ukupne varijanse:
∑( yˆi − y ) 2 ∑( yˆi − y ) 2 Objašnjena varijansa n r2 = = = Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n
(3.36)
127
Statistika u ekonomiji i menadžmentu
ili pomoću sljedećeg izraza: ∑( yi − yˆi ) 2 ∑( yi − yˆ i ) 2 Neobjašnjena varijansa n (3.37) 1 r2 = 1− = 1− = − Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n
Vrijednost ovog koeficijenta se kreće između nule i jedinice. On pokazuje koja je proporcija ukupne varijacije varijable Y objašnjena ocijenjenom regresionom jednačinom i uobičajeno je da se izražava u procentima. Veća vrijednost ovog koeficijenta ukazuje da je veća proporcija objašnjene u ukupnoj varijaciji i da je odabrani model pouzdaniji i reprezentativniji. Vrijednost koeficijenta determinacije u primjeru 3.1. je bila r2=0,86 što znači da linearni model u kojem je nezavisna (eksplikativna) varijabla proizvodnja u kilogramima objašnjava 86 % varijacije ukupnih prihoda posmatranog preduzeća. 3.4.2. Koeficijent korelacije Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti dvije pojave za koje poznajemo empirijske vrijednosti kvantitatinih varijabli i za koje pretpostavljamo da imaju linearnu vezu. Ovaj koeficijent ne zavisi od jedinica mjere. To je, dakle, neimenovan broj. Koeficijent linearne korelacije je definisan kao odnos kovarijanse varijabli X i Y i proizvoda standardnih devijacija varijable X i varijable Y.
r=
Cov( X , Y ) = σ X ⋅σY
∑ (x
i
∑ (x
i
− x )( yi − y )
− x) ⋅ 2
∑(y
i
− y)
2
(3.38)
Vrijednost koeficijenta linearne korelacije se nalazi između -1 i 1. Veća vrijednost koeficijenta ukazuje na postojanje veće linearne povezanosti između promjenjljivih X i Y. Potrebno je naglasiti da manja vrijednost ovog koeficijenta ne mora uvijek značiti da je slaba korelacija jer se može raditi o pogrešnoj primjeni koeficijenta linearne korelacije za mjerenje jačine veze pojava koje nisu u linearnom odnosu. • Za vrijednosti: -1 < r < 0 korelacija je negativna. • Za vrijednosti: 0 < r < 1 korelacija je pozitivna. 128
Poglavlje 3. – Regresiona i korelaciona analiza
•
Za vrijednosti –1 i 1, radi se o perfektnoj negativnoj, odnosno pozitivnoj korelaciji.
Koeficijent linearne korelacije možemo izraziti kao kvadratni korijen koeficijenta determinacije:
∑( yˆ i − y ) 2
r = r2 =
∑( y i − y ) 2
(3.39)
ili
r = 1−
∑( y i − yˆ i ) 2 ∑( y i − y ) 2
(3.40)
Koeficijent determinacije možemo izraziti koristeći definiciju koeficijenta linearne korelacije. U tom slučaju koeficijent determinacije izražavamo u sljedećem obliku:
r2 =
Cov 2 ( X , Y ) σ 2 X ⋅ σ 2Y
(3.41)
3.4.3. Standardna greška regresionog modela Pored koeficijenta linearne korelacije i koeficijenta determinacije, kvalitet ocjene se može mjeriti i pomoću standardne greške ocjene regresionog modela i koeficijenta varijacije ocijenjenog regresionog modela. Standardna greška ocijenjenog modela može se nazvati i rezidualnom standardnom greškom jer se definiše na osnovu rezidualnog zbira kvadrata odstupanja i jednaka je kvadratnom korijenu rezidualne (neobjašnjene) varijanse: n
σ yˆ =
∑( y i =1
i
− yˆ i ) 2
n
(3.42)
Standardna greška regresije mjeri kvalitet i reprezentativnost ocijenjenog regresionog modela i pokazuje prosječno odstupanje empirijskih vrijednosti zavisne varijable Y od vrijednosti ocijenjenih regresionim modelom. Standardna greška regresije je apsolutna mjera disperzije oko regresije jer se izražava u istim jedinicama mjere kao zavisna varijabla. 129
Statistika u ekonomiji i menadžmentu
3.4.4. Koeficijent varijacije regresionog modela Koefecijent varijacije ocijenjenog regresionog modela je relativni pokazatelj kvaliteta ocjene i jednak je odnosu standardne greške ocijenjenog regresionog modela i aritmetičke sredine zavisne varijable Y:
kVyˆ =
σ yˆ y
⋅100
(3.43)
Na osnovu vrijednosti ovog koeficijenta možemo procijeniti preciznost i kvalitet ocjene na sljedeći način:
•
Ako je 7%<
•
Ako je 4%<
•
Ako je 1%<
•
Ako je
σ yˆ y
σ yˆ y
σ yˆ y
σ yˆ y
≤1%
≤ 10% ocjena je dosta dobra ≤ 7%
ocjena je dobra
≤ 4%
ocjena je vrlo dobra ocjena je odlična.
Primjenu ovih parametara za procjenu kvaliteta ocjene ćemo ilustrovati na primjeru na kojem ćemo ocijeniti linearni i više različitih tipova nelinearnih regresionih modela da bismo odabrali model koji najbolje reprezentuje posmatrane podatke. 3.4.5. Aplikacija različitih oblika regresionog modela Na sljedećem primjeru ćemo aplicirati etape konstrukcije regresionog modela i izvršiti ocjenu različitih oblika modela.
130
Poglavlje 3. – Regresiona i korelaciona analiza
3.4.5.1. Linearni model
Primjer 3.3. Tabela 3.6. Godišnja stanarina u KM u 2003. prema veličini stana izraženoj brojem soba u stanu Stan (broj soba) X 1 2 3 4 5 7 Ukupno
Godišnja stanarina Y 1 870 2 480 3 470 4 980 6 900 11 560 31 260
Broj stanova fj 75 500 81 750 35 500 14 000 7 500 7 000 221 250
Statistička jedinica je stan. Podatke iz tabele možemo sintetizirati na sljedeći način: Tabela 3.7. Parametri za analizirane varijable
Aritmetička sredina Standardna devijacija Koeficijent varijacije
•
•
Stan (broj soba) 2,206 1,345 0,61
Godišnja stanarina 3 025,99 1 911,11 0,63
Prva etapa je izbor varijabli X i Y. Mi želimo objasniti godišnju stanarinu kao funkciju veličine stana. Varijabla X će predstavljati veličinu stana (broj soba) i to je nezavisna ili eksplikativna varijabla. Varijabla Y je godišnja stanarina i to je zavisna ili varijabla koju trebamo objasniti. Druga etapa je kompletiranje dijagrama rasipanja podataka.
131
Statistika u ekonomiji i menadžmentu 12000 11560
Godišnja stanarina
10000 8000 6900
6000 4980
4000 3470
2000 1870 0
0
1
2480 2
Grafikon 3.9.
•
3
4 Veličina stana
5
6
7
Dijagram rasipanja
Treća etapa je ocjena regresione prave. Posmatrajući dijagram rasipanja čini nam se, na prvi pogled, da bismo mogli ocijeniti linearnu regresionu jednačinu: yˆ i = a + bxi
Primjenom analiziranih postupaka ocjene dobijamo vrijednost parametara a i b: a = −755,14 i b = 1626,86 , i kompletiramo jednačinu ocijenjene regresione prave:
yˆi = −755,14 + 1626,86 xi Koeficijent linearne korelacije je r=0,9757 i koeficijent determinacije r2=0,9520. Značenje parametara a i b: parametar a predstavlja odsječak na ordinatnoj osi. Ovdje realno nema odsječka na Y osi jer ukoliko nema stanova za izdavanje, nema ni stanarine. Parametar b predstavlja nagib prave i značenje mu je sljedeće: ako se veličina stana poveća za jednu sobu, godišnja stanarina će u prosjeku rasti za 1626,86 KM. • Četvrta etapa je izračunavanje rezidualnih odstupanja. Uvrštavajući vrijednosti xi u gore ocijenjenu jednačinu, izračunat ćemo ocijenjene vrijednosti zavisne varijable. Rezultate računanja predstavljamo u sljedećoj tabeli.
132
Poglavlje 3. – Regresiona i korelaciona analiza
Tabela 3.8. Radna tabela za primjer 3.3.
xi
yi
yˆ i
y i − yˆ i
( y i − yˆ i )2
1 2 3 4 5 7 Ukupno
1 870 2 480 3 470 4 980 6 900 11 560 31 260
871,71 2 498,57 4 125,43 5 752,29 7 379,14 10 632,86 31 260
998,29 -18,57 -655,43 -772,29 -479,14 927,14 0
996 582,92 344,84 429 588,48 596 431,84 229 575,14 859 588,58 3 112 111,80
Pošto je
•
∑ yi = ∑ yˆi
treba izračunati
∑ ( yi − yˆi )2
Peta etapa: procjena kvaliteta ocijenjene linearne prave - rezidualna standardna devijacija
σ yˆ = -
( yi − yˆi ) 2 3112111,80 = = 720, 20 KM ∑ n 6 i =1 n
koeficijent varijacije regresije:
σ yˆ y
=
720,20 = 0,1382 ⇒ 13,82% 5210
Ova dva parametra imaju visoku vrijednost i ukazuju na vrlo loš kvalitet ocjene. Koeficijent linearne korelacije je r =0,9757 i koeficijent determinacije r2=0,9520. Vrijednost koeficijenta korelacije je blizu jedinici, a koeficijent determinacije znači da je 95,20 % varijabiliteta stanarine objašnjeno varijabilitetom veličina stana. Dakle, na osnovu vrijednosti ova dva koeficijenta mogli bismo zaključiti da je ocjena kvalitetna ali rezidualna standardna devijacija i koeficijent preciznosti ne potvrđuju ovaj rezultat.
133
Statistika u ekonomiji i menadžmentu
•
Šesta etapa: Analiza rezidualnih odstupanja
Tabela 3.9. Rezidualna odstupanja za primjer 3.3.
xi
Rezidualna odstupanja ( y i − yˆ i )
1 2 3 4 5 7 Ukupno
998,29 -18,57 -655,43 -772,29 -479,14 927,14 0
Kada je ocjena dobra i pouzdana, rezidualna odstupanja su slučajna i imaju malu vrijednost kao što smo već naveli analizirajući njihove osobine. Ako bismo predstavili dijagram rasipanja rezidualnih odstupanja vidjeli bismo da on ne zadovoljava gore navedene uslove i da ima paraboličan oblik. To znači da ocijenjeni linearni model ne možemo prihvatiti kao pouzdan i odbacujemo ga. Zbog toga ćemo ocijeniti nekoliko nelinearnih modela. 3.4.5.2. Eksponencijalni model Jednačina eksponencijalnog modela je:
yˆi = a ⋅ b xi
(3.44)
Ocijenjeni eksponencijalni model je dat sljedećim izrazom7:
yˆi = 1377,32 ⋅ 1,3648 xi Ako se broj soba uveća za jednu sobu, stanarina se prosječno uveća za 36,48%. Da bismo analizirali rezidualnu standardnu devijaciju i koeficijent preciznosti ocjene izračunali smo neophodne podatke na isti način kao u slučaju linearne ocjene i dobili rezidualnu standardnu devijaciju:
7
Ovaj i ostali modeli su ocijenjeni korištenjem programa RATS (Regression Analysis for Time Series). Analizirani modeli mogu biti ocijenjeni korištenjem programa Excel ili digitrona koji imaju odgovarajuće statističke funkcije.
134
Poglavlje 3. – Regresiona i korelaciona analiza
σ yˆ =
( yi − yˆi ) 2 539406,11 = = 299,83 KM ∑ 6 n i =1 n
i koeficijent varijacije:
σ yˆ y
=
299,83 = 0,0575 ⇒ 5,75% 5210
Ova ocjena je pouzdanija nego linearna. 3.4.5.3. Stepeni model Ocjenom jednačine stepenog modela: yˆ i = a ⋅ xib
(3.45)
dobili smo sljedeći rezultat:
yˆi = 1517,195 ⋅ xi0,9299 Kvalitet ocjene smo i u ovom slučaju procijenili standardnom devijacijom modela i koeficijentom varijacije:
σ yˆ = σ yˆ y
=
( y i − yˆ i ) 2 = ∑ n i =1 n
6398464,87 = 1032,67 KM 6
1032,67 = 19,82% 5210
Ova ocjena nije pouzdana zbog visoke standardne devijacije i koeficijenta varijacije. 3.4.5.4. Logaritamski model Jednačinu logaritamskog modela: yˆ i = a + b ⋅ ln xi
(3.46)
smo ocijenili i dobili sljedeći izraz:
yˆ i = 150,497 + 4508,4219 ln xi 135
Statistika u ekonomiji i menadžmentu
Dva parametra koja smo ocijenili i za ostale modele u ovom slučaju imaju sljedeće vrijednosti: n
σ yˆ =
σ yˆ y
=
∑( y i =1
i
− yˆ i )2
n
=
15483442,81 = 1606,42 KM 6
1606,42 = 30,83% 5210
Ni ova ocjena nije pouzdana zbog vrlo visoke vrijednosti standardne devijacije i koeficijenta varijacije. Rezultate dobijenih ocjena predstavljamo u tabeli 3.10. Tabela 3.10. Ocjene za različite regresione modele Model
σ yˆ
Linearni
Eksponencijalni
yˆ i = −755,14 + 1626,86 xi
yˆ i = 1377,32 ⋅ 1,3648 x
720,20 KM
299,83 KM
13,82%
5,75%
σ yˆ y
Model
Stepeni
yˆ i = 1517,195 ⋅ x
σ yˆ σ yˆ y
Logaritamski 0 , 9299 i
yˆ i = 150,497 + 4508,4219 ln xi
1032,67 KM
1606,42 KM
19,82%
30,83%
Na osnovu prezentovanih podataka zaključujemo da je ocjena eksponencijalnog modela najpouzdanija i najkvalitetnija jer ima najmanju standardnu devijaciju i najniži koeficijent varijacije. Eksponencijalni model se u analiziranom slučaju najbolje prilagođava datim podacima i reprezentuje vezu između visine stanarine i veličine stana. 136
Poglavlje 3. – Regresiona i korelaciona analiza
Primjer 3.4. Koeficijent linearne korelacije je mjera linearne korelacije između varijabli. Međutim, linearnu regresiju ne treba koristiti “automatski” uvijek kad dobijemo visok koeficijent linearne korelacije. Neophodno je, kao što smo već i naglasili, nacrtati dijagram rasipanja podataka koji nam može pomoći da vizuelno uočimo da li se radi o linearnoj vezi između dvije posmatrane varijable i da poslije izvršene ocjene provjerimo njen kvalitet izračunavanjem parametara koje smo već analizirali. Analizirat ćemo jedan poznati primjer koji je predložio Anscombe8 i na kojem je ilustrovana primjena linearne regresije na četiri distribucije podataka koje predstavljamo u tabeli 3.11. Tabela 3.11. Primjer četiri distribucije podataka Distribucija A
Distribucija B
Distribucija C
Distribucija D
xi
yi
xi
yi
xi
yi
xi
yi
10 8 13 9 11 14 6 4 12 7 5
8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68
10 8 13 9 11 14 6 4 12 7 5
9,14 8,14 8,74 8,77 9,26 8,1 6,13 3,1 9,13 7,26 4,74
10 8 13 9 11 14 6 4 12 7 5
7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73
8 8 8 8 8 8 8 19 8 8 8
6,58 5,76 7,71 8,84 8,47 7,04 5,52 12,5 5,56 7,91 6,89
Za svaku od četiri navedene distribucije varijabli X i Y izračunali smo sljedeće statističke pokazatelje. n = 11;
x = 9;
y = 7,5; σ x2 = 10; σ y2 = 3,75; Cov ( X , Y ) = 5
Koeficijent korelacije r =0,816.
8
Anscombe, F.J.: Graph in Statistical Analysis, The American Statistican 27, str. 17-21, prema Droesbeke, J.J.: Eléments de Statistiques, Ellipses, Paris, 1977. g., str. 398-399.
137
Statistika u ekonomiji i menadžmentu
Šest izračunatih pokazatelja su jednaki za sve četiri distribucije. Ako bismo posmatrali samo ove parametre i koeficijent linearne korelacije te ocijenili linearnu regresiju za sva četiri slučaja, napravili bismo grešku. Zbog toga uvijek treba prije ocjene analizirati dijagram rasipanja (analiza a priori) i poslije izvršene ocjene analizirati rezidualna odstupanja (analiza a posteriori). Pošto ponekad ni na osnovu dijagrama rasipanja ne možemo precizno odrediti oblik veze, potrebno je izvršiti ocjene više različitih modela i izabrati najpouzdaniju ocjenu na osnovu analiziranih kriterija. Na sljedećim grafikonima predstavljamo dijagrame rasipanja i linearnu pravu koju smo dobili ocijenjujući linearnu regresiju metodom najmanjih kvadrata.
yˆ = 3 + 0,5 x Koeficijent determinacije je jednak r2=0,667.
y
12 10 8 6 4 2 0
0
2
Grafikon 3.10.
138
4
6
8
10
12
A: Dijagram rasipanja i regresiona prava
14
x
16
Poglavlje 3. – Regresiona i korelaciona analiza
y 12 10 8 6 4 2 0
0
2
4
Grafikon 3.11.
6
8
10
12
14
x
B: Dijagram rasipanja i regresiona prava
y 14 12 10 8 6 4 2 0
x 0
2
4
Grafikon 3.12.
6
8
10
12
14
16
C: Dijagram rasipanja i regresiona prava
y
14 12 10
8 6 4 2 0
0
2
Grafikon 3.13.
4
6
8
10
12
14
16
18
20
x
D: Dijagram rasipanja i regresiona prava
139
Statistika u ekonomiji i menadžmentu
Konstatujemo i naglašavamo da je samo u slučaju A moguće prihvatiti i ocijeniti regresionu pravu. Za ostale slučajeve regresiona prava ne prezentuje adekvatno oblak rasipanja. Analiza a posteriori rezidualnih odstupanja u slučajevima B, C i D pokazuje da se u ova tri slučaja ne može prihvatiti ocjena regresione prave i da je potrebno tražiti i ocijeniti neki drugi model. 3.4.6. Spearmanov koeficijent korelacije ranga Za utvrđivanje stepena povezanosti između pojava za koje su podaci dati u obliku modaliteta rang varijable koristi se Spearmanov koeficijent korelacije ranga. Ovaj koeficijent korelacije se označava simbolom rs i određuje korištenjem sljedećeg izraza:
rs = 1 −
6 n( n
2
n
∑d − 1) i =1
2 i
di = r(xi) – r(yi), i=1, 2,...,n.
(3.47) (3.48)
di predstavlja razlike rangova za odgovarajuće parove vrijednosti varijabli ranga. Kao i za koeficijent linearne korelacije, vrijednost koeficijenta korelacije ranga se uvijek kreće između –1 i +1. Zavisnost je potpuna ako je |rs| = 1.
3.5. MODEL VIŠESTRUKE REGRESIJE Model višestruke ili multiple regresije možemo napisati u sljedećem obliku:
Y = f ( X 1 , X 2 ,...., X K ) + e
(3.49)
Zavisna varijabla Y je izražena kao funkcija K nezavisnih varijabli i slučajnog odstupanja e. Ukoliko je funkcionalni dio modela definisan linearnom funkcijom možemo definisati standardni model višestruke linearne regresije sljedećim izrazom:
Y = a + b1 X 1 + b2 X 2 + ... + bK X K + e
(3.50)
odnosno za n vrijednosti:
y i = a + b1 xi1 + b2 xi 2 + ... + bK xiK + ei , i = 1,2,..., n . 140
(3.51)
Poglavlje 3. – Regresiona i korelaciona analiza
Koeficijenti u regresionom modelu imaju sljedeće značenje: parametar a je slobodni, konstantni član koji predstavlja očekivanu vrijednost zavisne varijable Y kada je vrijednost svih K nezavisnih varijabli (X1, X2,...,XK) jednaka nuli. Vrijednost ovog parametra nema uvijek logičko objašnjenje. Parametar bi (i=1,2,....,K) ili regresioni koeficijent pokazuje prosječnu promjenu zavisne varijable Y uslovljenu jediničnim povećanjem nezavisne varijable Xi, uz uslov da ostale nezavisne varijable ostanu nepromijenjene. Pozitivna vrijednost parametra bi ukazuje na proporcionalan odnos varijabli Y i Xi. To znači da rast nezavisne varijable Xi uslovljava rast zavisne varijable Y. Negativna vrijednost koeficijenta bi znači obrnuto proporcionalan odnos zavisne varijable Y i nezavisne varijable Xi. U ovom slučaju smjer promjene nezavisne i zavisne varijable je suprotan, odnosno rast Xi uzrokuje opadanje zavisne varijable Y, a opadanje Xi uzrokuje rast zavisne varijable Y. 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica Koeficijent multiple determinacije je definisan sljedećim izrazom:
RY2;1, 2,.., K =
∑( yˆ i − y ) 2 , 0 ≤ RY2;1, 2 ,..,K ≤ 1 2 ∑ ( yi − y )
(3.52)
Koeficijent multiple linearne korelacije mjeri jačinu varijabiliteta između zavisne varijable i zbirnog varijabiliteta K nezavisnih varijabli. Određuje se kao kvadratni korijen koeficijenta multiple determinacije:
RY ;1, 2,.., K =
∑( yˆ i − y ) 2 , 0 ≤ RY ;1, 2,.., K ≤ 1 ∑ ( yi − y ) 2
(3.53)
ili pomoću izraza:
RY ;1, 2,.., K =
∑( yi − y )( yˆ i − y ) nσ yσ y
(3.54)
Koeficijentu se ne pridružuje predznak jer odnosi između zavisne i nezavisnih varijabli mogu biti raznosmjerni. Koeficijent parcijalne korelacije pokazuje jačinu i smjer veze zavisne varijable Y i j-te nezavisne 141
Statistika u ekonomiji i menadžmentu
varijable uz nepromijenjen uticaj preostalih (K-1) varijabli koje označavamo sa c. Vrijednost ovog koeficijenta se kreće u sljedećim granicama: − 1 ≤ ry ; j ,c ≤ 1 . Koeficijenti parcijalne korelacije prvog reda za K=2 definišu se pomoću koeficijenata jednostavne linearne korelacije na sljedeći način:
ry ;1,2 =
ry ;1 − ry ;2 r1,2 (1 − ry2;1 )(1 − r1,22 )
; ry ;2,1 =
ry ;2 − ry ;1 r1,2 (1 − ry2;2 )(1 − r1,22 )
(3.55)
Pored koeficijenata multiple i parcijalne korelacije, u višedimnzionalnoj regresionoj analizi se primjenjuju i koeficijenti jednostavne linearne korelacije. Ovi koeficijenti se predstavljaju u obliku korelacione matrice: ⎡1 ry1 .... ryK ⎤ ⎢ ⎥ ⎢ r1 y 1 .... r1K ⎥ R = ⎢ r2 y r21 .... r2 K ⎥ ⎢ ⎥ ⎢.......................... ⎥ ⎢ ⎥ ⎣⎢ rKy rK 1 .... 1 ⎦⎥
(3.56)
U prvom redu matrice R se nalaze koeficijenti jednostavne linearne korelacije između zavisne i svake nezavisne varijable. U prvoj koloni su koeficijenti jednostavne linearne korelacije između svake nezavisne i zavisne varijable. Za koeficijente jednostavne linearne korelacije vrijedi osobina simetričnosti. To znači da se vrijednost koeficijenta jednostavne linearne korelacije ne mijenja ako se zamijeni mjesto varijabli: ryj = rjy ,
j = 1,2,...., K .
rjk = rkj ,
j , k = 1,2,...., K .
Iz navedenog zaključujemo da je korelaciona matrica simetrična. Na glavnoj dijagonali se nalaze jedinice, jer je koeficijent jednostavne linearne korelacije jedne varijable sa tom varijablom jednak jedinici. 3.5.2. Analiza numeričkog primjera Na sljedećem primjeru ćemo ilustrovati ocjenu višestrukog regresionog modela i značenje ocijenjenih parametara.
142
Poglavlje 3. – Regresiona i korelaciona analiza
Primjer 3.5. Tabela 3.12. Prihod preduzeća izražen u hiljadama KM (Y), proizvodnja izražena u kilogramima (X1) i troškovi proizvodnje po kg (X2) izraženi u KM.
Y 20 25 25 35 30 35 40
X1 50 100 150 200 250 300 350
X2 280 260 260 248 196 178 160
Ocijenićemo regresioni model Y = a + b1 X 1 + b2 X 2 primjenom Excela. Izlazne tabele Excela nam daju sljedeće rezultate. Tabela 3.13. (a.,b.,c.) Output Excela za multiplu regresiono-korelacionu analizu na primjeru 3.5.
a. SUMMARY OUTPUT REGRESSION STATISTICS Multiple R 0,9528 R Square 0,9078 Adjusted R Square 0,8617 Standard Error 2,6292 Observations 7
b.
Regression Residual Total
df 2 4 6
ANOVA SS MS 272,3485 136,1742 27,6515 6,9129 300
F 19,6986
Significance F 0,0085
143
Statistika u ekonomiji i menadžmentu
c. COEFFICIENTS STANDARD ERROR T- STAT P-VALUE Intercept -20,7251 26,9055 -0,7703 0,4841 X1 0,1130 0,0377 3,0000 0,0399 X2 0,1245 0,0865 1,4389 0,2236
Ocijenjeni regresioni model je:
Y = −20,7251 + 0,1130 X 1 + 0,1245 X 2 Zavisna varijabla Y predstavlja prihod preduzeća izražen u hiljadama KM, varijabla X1 je proizvodnja izražena u kilogramima i varijabla X2 troškovi proizvodnje po kg izraženi u KM. Značenje dobijenih rezultata je sljedeće: konstantni član a = -20,7251. Ukoliko ne bi bilo proizvodnje, niti troškova proizvodnje, očekivani prihod bi bio negativan. Prihod se ne bi ostvarivao, a morale bi se plaćati već preuzete obaveze vezane za pokretanje proizvodnje. Značenje parametra uz varijablu X1 čija je vrijednost 0,1130 je sljedeće: ukoliko se proizvodnja poveća za jedan kg, prihod će se povećati za 1130 KM uz pretpostavku da troškovi po jedinici proizvoda ostaju nepromijenjeni. Koeficijent uz varijablu X2 je jednak 0,1245. Ukoliko bi se troškovi proizvodnje po jedinici proizvoda povećali za 1 KM, prihod bi se povećao za 1245 KM, uz pretpostavku da nivo proizvodnje ostaje nepromijenjen. Koeficijent multiple korelacije R koji predstavlja povezanost izmedu zavisne i dvije nezavisne varijable je jednak R = 0,95. To znači da postoji jaka povezanost između ukupnog prihoda Y i dvije posmatrane nezavisne varijable koje su proizvodanja izražena u kg i troškovi po jedinici proizvodnje. Koeficijent multiple determinacije R2 predstavlja dio varijacije zavisne varijable objašnjen ocijenjenim linearnim regresionim modelom. Njegova vrijednost je R2 = 0,91 što znači da je 91% varijacije prihoda objašnjeno proizvodnjom izraženom u kg i troškovima po jedinici proizvoda. Statistička značajnost regresijskog modela je određena empirijskim F omjerom i odgovarajućom p vrijednosti u tabeli ANOVA. U našem slučaju p = 0,0085 < 0,01 pa zaključujemo da barem jedna od nezavisnih varijabli statistički značajno utiče na vrijednost zavisne varijable uz nivo rizika od 1%. U izlaznoj tabeli Excela prezentovane su i statističke značajnosti 144
Poglavlje 3. – Regresiona i korelaciona analiza
regresionih koeficijanata koje se određuju pomoću t-statistike i pripadajućih p vrijednosti. Za varijablu X1 vrijednost p= 0,0399, a za X2 p=0,2236. Konstatujemo da u ocijenjenom regresionom modelu varijabla proizvodnja u kg statistički značajno utiče na zavisnu varijablu Y zbog toga što je odgovarajuća vrijednost p manja od 0,05. Za drugu varijablu p vrijednost je veća od 0,05 i to znači da uticaj troškova po jedinici proizvodnje u ovom modelu nije statistički značajan.
3.6. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6.
Na kojem kriteriju je bazirana metoda najmanjih kvadrata? Napišite formule za ocjenu parametara a i b regresione prave. Objasnite značenje parametara a i b regresione prave. Definišite i objasnite kovarijansu. Da li je kovarijansa pokazatelj nezavisnosti posmatranih pojava? Koji koeficijenti služe za mjerenje jačine i smjera povezanosti ekonomskih pojava? 7. Definišite i objasnite značenje koeficijenta determinacije. 8. U kojem intervalu se mogu kretati vrijednosti koeficijenta determinacije? 9. Definišite i objasnite koeficijent linearne korelacije? 10. Koje vrijednosti može imati koeficijent linearne korelacije? 11. Definišite varijansu zbira i razlike dvije nezavisne statističke varijable. 12. Definišite varijansu zbira i razlike dvije statističke varijable. 13. Napišite izraz za dekompoziciju ukupne varijanse. 14. Definišite rezidualnu (neobjašnjenu) varijansu. 15. Definišite objašnjenu varijansu.
145
Statistika u ekonomiji i menadžmentu
3.7. RIJEŠENI ZADACI
Zadatak 1. U sljedećoj tabeli su dati podaci o troškovima promocije i prihodu od prodaje proizvoda Z: Godine
1999 2000 2001 2002 2003 2004 2005
Troškovi promocije (u 000 eura) 50 20 10 30 80 100 120
Prihod od prodaje (u 000 eura) 280 220 180 220 320 330 350
Prvi dio: 1. Odredite zavisnu i nezavisu varijablu? 2. Predstavite dijagram rasipanja. Koji tip funkcije se najbolje prilagođava datom dijagramu? 3. Koji je, po vašem mišljenju, znak kovarijanse između dvije posmatrane varijable? 4. Izračunajte jednačinu regresione prave. 5. Predstavite grafički ovu pravu na dijagramu rasipanja. Komentarišite. 6. Izračunajte koeficijent linearne korelacije i koeficijent determinacije i objasnite njihova značenja. 7. Marketing servis predviđa za 2006 godinu budžet za promociju u iznosu od 125000 €. Procijenite prihod od prodaje za 2006 godinu. Komentarišite.
146
Poglavlje 3. – Regresiona i korelaciona analiza
Drugi dio: Godine
Posmatrana prodaja
yi 1999 2000 2001 2002 2003 2004 2005 Ukupno
280 220 180 220 320 330 350 1900
Prodaja procijenjena modelom
( yi − yˆi )2
( yˆi − y )2
yˆi 258,50 213,26 198,18 228,34 303,74 333,90 364,06 1900
462,14 45,40 330,58 69,59 264,28 15,24 197,80 1385,03
167,08 3383,35 5365,09 1856,43 1044,24 3903,15 8581,35 24300,69
1. Provjerite rezultat prve linije gornje tabele za 1999. godinu. 2. Uporedite aritmetičku sredinu posmatranih prodaja i aritmetičku sredinu procijenjenih prodaja. 3. Izračunati neobjašnjenu varijansu i varijansu objašnjenu regresijonom pravom. 4. Provjerite numerički jednakost: Ukupna varijansa = Objašnjena varijansa + Neobjašnjena (rezidualna) varijansa. 5. Provjerite vrijednosti dobijene za koeficijent determinacije u prvom dijelu. Elementi rješenja:
Prvi dio: 1. U ovom primjeru promjenljiva Y, prihod od prodaje proizvoda Z, je zavisna promijenljiva. Posmatramo je kao funkciju nezavisne promjenljive troškovi promocije X.
147
Statistika u ekonomiji i menadžmentu
Prihod
2.
400
yˆ = 1,508 x + 183,1 R 2 = 09461
300 200 100 0
0
20
40
60
80
100
120
140
Troškovi reklame Grafikon 3.14
Dijagram rasipanja i regresiona prava
3. Kovarijansa je pozitivna. 4. yˆ = 183,1 + 1,51x 5. Model linearne regresije se najbolje prilagođava datim podacima. 6. Koeficijent linearne korelacije r je jednak 0,97. To znači da postoji visok stepen linearne korelacije između dvije posmatrane varijable. Vrijednost koeficijenta determinacije je jednaka 0,946 i to znači da je 94,6% varijacije prihoda objašnjeno troškovima promocije.
r= r2 =
Cov( X , Y )
σ XσY Cov 2 ( X ,Y )
σ x2 σ y2
= 0,972 = 0,946
7. Y ocjenjeno za 2006. godinu:
yˆ = 183,1 + 1,51x
yˆ = 183,1 + 1,51 ⋅ 125 = 371,85 Ako bi budžet za promociju u 2006. godini iznosio 125 000 eura, prihod od prodaje u ovoj godini bi bio 371850 eura. 148
Poglavlje 3. – Regresiona i korelaciona analiza
Drugi dio: 1. Y procjenjeno za 1999
yˆ = 183,1 + 1,51 ⋅ 50 = 258,6 2. Aritmetička sredina posmatranih prodaja i aritmetička sredina procijenjenih prodaja su jednake 271,43. 3. Neobjašnjena varijansa:
σ y2 / x =
∑( y i − yˆ i ) 2 1385.03 = = 197.86 n 7
Objašnjena varijansa:
σ
2 y/x
∑( yˆ i − y ) 2 24300.69 = = = 3471.52 n 7
4. Ukupna varijansa: ∑( y − y ) 2 ∑( y i − yˆ i ) 2 ∑( yˆ i − y ) 2 = + = 197.86 + 3471.52 = 3669.38 n n n 5.
r2 =
objašnjena varijansa 3471.52 = = 0.946 ukupna varijansa 3669.38
r2 =1−
neobjašnjena varijansa 197.86 =1− = 1 − 0.0539 = 0.946 ukupna varijansa 3669.38
Zadatak 2. U sljedećoj tabeli posmatramo kretanje varijabli X i Y. Y je zavisna varijabla. Godine 1999 2000 2001 2002 Ukupno
X 0 3 5 8 16
Y 2 5 3 6 16
149
Statistika u ekonomiji i menadžmentu
Poznate su sljedeće vrijednosti: aritmetička sredina varijable X jednaka je 4, varijansa od X jednaka je 8,5, aritmetička sredina varijable Y jednaka je 4, varijansa od Y jednaka je 2,5 i Cov(X, Y)=4. 1. Odrediti jednačinu regresione prave. 2. Izračunati koeficijent determinacije i objasniti ga. Elementi rješenja:
b=
Cov( X , Y )
σ
2 X
=
4 = 0, 47 8,5
a = y − bx = 4 − 0, 47 ⋅ 4 = 2,12 yˆ = 2,12 + 0, 47 x r = 2
Cov 2 ( X , Y )
σ σ 2 X
2 Y
=
4 = 0,188 8,5 ⋅ 2,5
Zadatak 3. Za varijable X i Y poznato je 15 parova vrijednosti (xi, yi). Y je zavisna varijabla. Poznati su sljedeći parametri ove dvije distribucije:
x = 4,
σ X2 = 3.75
y = 4,
σ Y2 = 3
i koeficijent pravca regresione prave: b = - 0.8 1. Odredite jednačinu regresione prave. 2. Izračunajte koeficijent linearne korelacije. 3. Odredite varijansu objašnjenu regresionom pravom. Elementi rješenja:
a = y − bx = 4 + 0,8 ⋅ 4 = 7, 2 yˆ = 7, 2 − 0,8 x r=
150
Cov( X , Y )
σ XσY
Poglavlje 3. – Regresiona i korelaciona analiza
b=
Cov ( X , Y )
σ X2
⇒
Cov ( X , Y ) = b ⋅ σ X2 = −0,8 ⋅ 3,75 = −3 r=
Cov ( X , Y )
r2 =
σ XσY
=
−3 = −0,89 3,35
Objašnjena varijansa ⇒ Ukupna varijansa
Objašnjena varijansa = r 2 ⋅ Ukupna varijansa = 0, 79 ⋅ 3 = 2,37
151
POGLAVLJE 4.
DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE
Za istraživanje i analizu promjena pojava u vremenu primjenjuju se metode dinamičke analize. Dinamička analiza omogućava praćenje promjena pojava u vremenu i predviđanje tendencije razvoja pojava.
4.1. APSOLUTNA I RELATIVNA PROMJENA Apsolutna promjena pojave V između datuma t i datuma 0 je jednaka:
ΔV = Vt − Vo
(4.1)
Apsolutna promjena je izražena u jedinicama mjere analizirane varijable. Apsolutna promjena može biti negativna. Relativna promjena veličine pojave V između perioda t i 0 je jednaka:
ΔV Vt − V0 = V V0
(4.2)
153
Statistika u ekonomiji i menadžmentu
Relativna promjena se naziva stopa promjene. Ukoliko je stopa promjene pozitivna naziva se stopa rasta. Stopu promjene možemo izraziti i sljedećom formulom:
ΔV Vt − V0 Vt = = −1 V V0 V0
(4.3)
Izračunavanje i objašnjenje apsolutne i relativne promjene ćemo ilustrovati na primjeru 4.1.
Primjer 4.1. Tabela 4.1. Broj studenata i nastavnog osoblja na fakultetima u Federaciji BiH
Kod za školsku godinu Redovni studenti Vanredni studenti Nastavnici Saradnici Broj fakulteta
1997/98 1998/99 1999/00 (1) (2) (3) 22 697 26 649 28 912 6 451 9 315 11 483 1 250 1 294 1 442 1 080 1 185 1 248 40 48 47
2000/01 (4) 31 861 11 360 860 913 48
2001/02 (5) 32 614 12 192 777 898 48
Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, str.309.
U koloni posmatramo strukturu studenata, nastavnog osoblja i broja fakulteta. U 2001/02 godini je bilo 32 614 redovnih i 12 192 vanredna studenta. Broj nastavnika je bio 777, a saradnika 898. Broj fakulteta je bio 48. Za svaku od posmatranih godina možemo analizirati datu strukturu. Analiza redova u datoj tabeli omogućava istraživanje evolucije analiziranih pokazatelja i struktura u vremenu. Na grafikonima 4.1. i 4.2. je prezentirana struktura posmatranih pokazatelja i njihova evolucija u vremenu.
154
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
35000 30000
redovni studenti
25000
vanredni studenti
20000
nastavnici saradnici
15000 10000 5000 0
1997/98
Grafikon 4.1.
1998/99
1999/00
2000/01
2001/02
Struktura studenata i nastavnog osoblja
35000 30000
1997/98
25000
1998/99
20000
1999/00
15000
2000/01 2001/02
10000 5000 0
redovni
Grafikon 4.2.
vanredni
nastavnici
saradnici
Evolucija broja studenata i nastavnog osoblja
U posmatranom periodu broj studenata, redovnih i vanrednih, je u stalnom porastu. Broj nastavnika i saradnika pokazuje tendenciju opadanja od 1999/00 godine. Koristeći prezentiranu i analiziranu definiciju i izraz za apsolutnu promjenu izračunali smo i prezentirali u narednoj tabeli apsolutne stope promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine.
155
Statistika u ekonomiji i menadžmentu
Tabela 4.2. Apsolutne promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine
Redovni studenti Vanredni studenti Nastavnici Saradnici
ΔV2-1 3 952 2 864 44 105
ΔV3-2 2 263 2 168 146 63
ΔV4-3 2 949 -123 -582 -335
ΔV5-4 753 832 -83 -15
ΔV5-1 9 917 5 741 -473 -182
Najveća apsolutna promjena broja redovnih studenata je bila između 1997/98 i 1998/99 akademske godine. Broj redovnih studenata se u periodu između ove dvije akademske godine povećao za 3952. Najmanja apsolutna promjena je bila između 2000/01 i 2001/02 akademske godine. Broj studenata se povećao za samo 753. Apsolutna promjena broja redovnih studenata između 2001/02 i 1998/99 je bila 9 917 studenata. Ovu apsolutnu promjenu smo izračunali na osnovu definicije apsolutne promjene. Apsolutnu promjenu u ovom periodu možemo izračunati i sabiranjem uzastopnih apsolutnih promjena u posmatranim godinama:
ΔV5-1= ΔV2-1+ΔV3-2+ΔV4-3+ΔV5-4 . Npr. za redovne studente: 9917=3952+2263+2949+753. Na isti način bismo mogli utvrditi apsolutne promjene i za ostale posmatrane kategorije. Apsolutne promjene broja vanrednih studenata su bile pozitivne, osim u periodu između 1999/00 i 2000/01 godine. Apsolutne promjene broja nastavnika i saradnika su bile pozitivne u prve dvije akademske godine, a u naredne dvije godine su bile negativne što ukazuje na to da se broj nastavnika i saradnika smanjio u tim godinama. Broj nastavnika se smanjio za 473 u 2001/02 u odnosu na 1997/98 godinu. U posmatranom periodu, za tri od pet akademskih godina utvrdili smo negativnu apsolutnu promjenu saradnika.
156
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.3. Relativna promjena broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine
Redovni studenti Vanredni studenti Nastavnici Saradnici
V2 − V1 V1
V3 − V2 V2
V4 − V3 V3
V5 − V4 V4
V5 − V1 V1
17,41 44,39 3,52 9,72
8,49 23,27 11,28 5,32
10,20 -1,07 -40,36 -26,84
2,36 7,32 -9,65 -1,64
43,69 88,99 -37,84 -16,85
Relativne promjene redovnih studenata su u svim posmatranim godinama bile pozitivne. U periodu između 1997/98 i 2001/02 godine stopa promjene je dostigla nivo 43,69%. Relativne promjene, odnosno stope promjene se ne mogu sabirati. Stope promjene ne posjeduju osobine računanja. Stopa promjene u periodu između 1998/99 i 2001/02 godine nije jednaka zbiru stopa promjene za pojedine godine posmatranog perioda:
ΔV5 −1 ΔV2 −1 ΔV3− 2 ΔV4 − 3 ΔV5 − 4 ≠ + + + V1 V1 V2 V3 V4 Ovu osobinu stope promjene provjeravamo na primjeru redovnih studenata: 43,69≠17,41+8,49+10,20+2,36=38,48 Najveću stopu rasta konstatujemo kod vanrednih studenata između prve i posljednje posmatrane akademske godine. Stopa rasta je bila 88,99 %. Negativne stope promjene konstatujemo u dva perioda kod nastavnika i saradnika. U 2001/02 u odnosu na 1997/98 godinu broj nastavnika se smanjio za 37,84 %, a broj saradnika za 16,85 %. Da bi analiza bila kompletna, potrebno je istovremeno posmatrati i relativne i apsolutne promjene. U narednom primjeru ćemo grafički ilustrovati, izračunati i analizirati apsolutne i relativne promjene broja nezaposlenih u Federaciji Bosne i Hercegovine prema stručnoj spremi.
157
Statistika u ekonomiji i menadžmentu
Tabela 4.4. Broj nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1998 2 851 2 358 48 383 84 273 10 786 107 836 256 487
VSS VSS SSS VKV, KV PKV, NSS NKV Ukupno
1999 2 635 2 485 49 870 87 852 14 997 103 954 261 793
2000 2 853 2 827 51 684 90 330 15 226 98 853 261 773
2001 3 043 3 236 54 877 95 359 15 965 96 524 269 004
Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, 2002, str.270.
120,000 VSS
100,000
VŠS
80,000
SSS
60,000
VKV, KV
40,000
PKV, NSS
20,000
NKV
0
1998
Grafikon 4.3.
1999
2000
2001
Struktura nezaposlenih prema stručnoj spremi u Federaciji BiH
120,000 100,000 1998
80,000
1999
60,000
2000
40,000
2001
20,000 0
VSS
Grafikon 4.4.
158
VŠS
SSS
VKV, KV
PKV, NSS
NKV
Evolucija broja nezaposlenih u Federaciji BiH prema stručnoj spremi
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.5. Apsolutne promjene broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1999/98 -216 127 1 487 3 579 4 211 -3 882 5 306
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
2000/99 218 342 1814 2 478 229 -5101 -20
2001/00 190 409 3 193 5 029 739 -2 329 7 236
2001/98 192 878 6494 11 086 5 170 -11312 12 517
15000
Absolutna promjena
10000 5000 NKV 0 -5000
VSS
-10000
VŠS
1998/99
SSS
VKV, KV
1999/00
2000/01
PKV, NSS
1998/01
-15000
Grafikon 4.5.
Absolutne promjene broja nezaposlenih u Federaciji BiH
Tabela 4.6. Relativna promjena broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi u %
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
1999/98 -7,58 5,38 3,07 4,25 39,04 -3,60 2,07
2000/99 8,27 13,76 3,64 2,82 1,53 -4,91 -0,008
2001/00 6,66 14,47 6,18 5,57 4,85 -2,36 2,76
2001/98 6,73 37,23 13,42 13,15 47,93 -10,49 4,88
159
Relativna stopa promjene
Statistika u ekonomiji i menadžmentu % 60
1999/98
50
2000/99
2001/00
2001/98
40 30 20 10 0 -10
VSS
VŠS
SSS
VKV, KV
PKV, NSS NKV
-20 Grafikon 4.6.
Relativne stope promjene nezaposlenih u Federaciji BiH u %
Na osnovu izračunatih i prezentiranih parametara i njihovih grafičkih prikaza možemo dati kompletnu analizu evolucije nezaposlenih osoba prema stručnoj spremi. Grafički prikazi koje smo kompletirali su ilustrativniji od desetine rečenica jer nam omogućavaju vizuelno posmatranje promjena i u strukturi i u evoluciji nezaposlenih u posmatranom periodu. Zapažamo da je došlo do porasta broja nezaposlenih više i srednje stručne spreme, kao i svih kategorija kvalifikovanih radnika. Jedino smanjenje broja nezaposlenih bilježe nekvalifikovani radnici. Ove konstatacije potvrđuju i izračunate relativne promjene.
4.2. INDEKSI Statistička analiza razlikuje apsolutne i relativne promjene. Termin relativne promjene se razvio na više nivoa u slučajevima kada se porede različite veličine u prostoru i vremenu. Za opis i poređenje evolucije pojava i varijabli čiji je red veličina različit najčešće se koriste indeksi. Indeks je broj koji objašnjava relativnu promjenu jednostavne ili kompleksne veličine između dva perioda, od kojih se jedan odabire kao bazni period. Kako je indeks odnos između dvije veličine iste prirode, on ne posjeduje jedinicu mjere. Indeks je, dakle, neimenovan broj.
160
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Najpoznatija dihotomija ideksa je na individualne (elementarne, proste) i agregatne (sintetičke) indekse. • Individualni indeksi se primjenjuju u slučaju kada želimo analizirati homogene veličine. Individualni indeksi se konstruišu tako da fiksiramo bazni period i izračunavamo promjenu posmatrane veličine između posmatranog perioda, koji ćemo označiti sa t, i baznog perioda, koji označavamo sa 0. Individualni indeks je bazni elemenat statističke analize hronoloških serija. • Agregatni indeksi se baziraju na istim principima, ali se primjenjuju za analizu heterogenih veličina. Neki od njih služe kao referentni indeksi. Najpoznatiji su indeksi vrijednosti, indeksi cijena, indeksi fizičkog obima proizvodnje, indeksi troškova života, berzni indeksi (Dow Jones, CAC 40), itd. Njihova konstrukcija je tehnički i metodološki vrlo komplikovana što ponekad otežava njihovo tumačenje. Praktična korisnost indeksa dolazi posebno do izražaja ako se analiza vrši za duži period. Fiksira se bazna godina za koju je indeks jednak 1 (ili 100), zatim se računaju indeksi za svaku godinu. Ukoliko su indeksi veći od 100, posmatrana pojava je relativno rasla u odnosu na bazni ili prethodni period. Kada su indeksi manji od 100, analizirana pojava je opadala u odnosu na bazni ili prethodni period. Indeksi nam pružaju direktno sintetički pogled na evoluciju u odnosu na bazni ili prethodni period i omogućavaju praćenje promjena analiziranih veličina između svih posmatranih perioda. 4.2.1. Individualni indeksi Individualni indeks se primjenjuje za analizu promjena u vremenu posmatrane veličine, kao i za poređenje evolucije više različitih veličina. Indeksi se mogu izraziti u odnosu na bazu 1 ili 100. Za izračunavanja se, iz praktičnih razloga, koriste indeksi u bazi 1. Konačni rezultati se prezentiraju u formi indeksa čija je baza 100 ili u obliku stope promjene u procentima. Indeks nema jedinice mjere. Indeks je, kao što smo već naveli, neimenovan broj koji ima veliku praktičnu upotrebu. Individualni indeksi se mogu izračunavati na osnovu stalne i promjenljive baze.
161
Statistika u ekonomiji i menadžmentu
4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) Bazne indekse ili indekse sa stalnom bazom izračunavamo kao količnik između veličine analizirane pojave u posmatranom i odabranom baznom periodu. Da bismo izračunali indeks sa stalnom bazom potrebno je prvo odabrati baznu godinu za koju indeks ima vrijednost 1 (ili 100). Ako sa Vt označimo veličinu analizirane pojave u periodu t i sa V0 označimo veličinu analizirane pojave u baznom periodu, individualni indeks između ta dva perioda ćemo izračunati na sljedeći način:
it / 0 =
Vt V0
(4.4)
Individualni indeks veličine V za period t u odnosu na bazni period 0 ako je baza 100 u periodu 0 je dat sljedećim izrazom:
I t / 0 = it / 0 ⋅ 100 =
Vt ⋅ 100 9 V0
(4.5)
Bazni indeksi se definišu kao indeksi razvoja. Ovi indeksi su pokazatelj razvoja pojava u posmatranom periodu u odnosu na bazni period. Bazni indeksi se koriste i za poređenja razvoja više pojava. Indeksi sa stalnom bazom se koriste za analizu i poređenja na isti način kao i originalni podaci o vrijednostima posmatranih pojava. Razlika između dva bazna indeksa je pokazatelj indeksnih poena. Na bazi podataka iz tabele 4.4., izračunali smo bazne indekse nezaposlenih osoba prema stručnoj spremi. Za bazu smo odabrali 1998. godinu. Izračunate indekse prezentujemo u tabeli 4.7.
9
Sa malim i označavamo proste indekse ako su izraženi u bazi 1. Množenjem ovih indeksa sa 100 dobijamo indekse izražene u bazi 100 i označavamo ih sa velikim slovom I.
162
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.7. Bazni indeksi I t / 0
I1998 100 100 100 100 100 100 100
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07
I00/98 100,07 119,89 106,82 107,19 141,16 91,67 102,06
I01/98 106,73 137,23 113,42 113,15 148,02 89,51 104,88
Indeks nezaposlenosti za visoku stručnu spremu u 1999.g. baza 100 u 1998.g. je jednak 92,42. To znači da je nezaposlenost VSS u tom periodu opala za 7,58 %. Indeks nezaposlenosti VSS u 2001. baza 100 u 1998.g. je 106,73. Stopa rasta nezaposlenosti VSS u ovom periodu je bila 6,73%. Indeks ukupnog broja nezaposlenih u periodu 1998.-2001. godine je bio 104,88. U ovom periodu ukupan broj nezaposlenih je porastao za 4,88%. Po analogiji sa datim objašnjenjima mogli bismo analizirati i ostale podatke iz tabele 4.7. za sve kategorije nezaposlenih u posmatranim periodima. Na dva grafikona koji slijede smo predstavili bazične indekse nezaposlenih osoba visoke stručne spreme (VSS). 110
106,73
105 100
100
95
100,07
92,42
90 85
1998
Grafikon 4.7.
1999/98
2000/98
2001/98
Bazni indeksi broja nezaposlenih VSS baza 100 u 1998.g.
163
Statistika u ekonomiji i menadžmentu
110
106,73
105
100
100
100,07
95
92,42 90
1999/98
1998
Grafikon 4.8.
2000/98
2001/98
Bazni indeksi broja nezaposlenih VSS, baza 100 u 1998. godini
2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) Indeksi sa promjenljivom bazom predstavljaju odnose veličine pojave u posmatranom i prethodnom periodu. Da bismo konstruisali indekse sa promjenljivom bazom ili lančane indekse kao bazni period odabiremo svaki put prethodni period. Indekse sa promjenljivom bazom izračunavamo tako da za bazu uzimamo svaki put podatke iz prethodnog perioda. Lančani indeks veličine V u periodu t u odnosu na period (t-1) ako je baza 1 u periodu (t-1) je jednak:
it / t −1 =
Vt Vt −1
(4.6)
Lančani indeks veličine V za period t u odnosu na period (t-1) ako je baza 100 u periodu (t-1) je jednak:
I t / t −1 = it / t −1 ⋅ 100 =
Vt ⋅ 100 Vt −1
(4.7)
Ovi indeksi se nazivaju i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene posmatrane pojave u odnosu na prethodni period. Koristeći podatke iz tabele 4.4. izračunali smo lančane indekse nezaposlenih osoba prema stručnoj spremi. Izračunate indekse prezentujemo u tabeli 4.8.
164
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.8. Lančani indeksi I t/t-1
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07
I00/99 108,27 113,76 103,64 102,82 101,53 95,09 99,99
I01/00 106,66 114,47 106,18 105,57 104,85 97,64 102,76
Ukupan broj nezaposlenih se povećao u 1999. u odnosu na 1998. godinu za 2,07%. Između 1999. i 2000.g. broj nezaposlenih je ostao skoro nepromijenjen. U periodu 2000.-2001. godina ukupan broj nezaposlenih se povećao za 2,76%. Na sljedećem grafikonu su predstavljeni lančani indeksi nezaposlenih visoke stručne spreme (VSS). 110 108 106 104 102 100
1998
98
1999
2000
2001
96 94 92 90
Grafikon 4.9.
Lančani indeksi nezaposlenih VSS
Koristeći podatke o broju diplomiranih studenata na ekonomskim fakultetima i Fakultetu za poslovni menadžment u Sarajevu izračunali smo bazne i lančane indeksa koje zajedno sa podacima predstavljamo u sljedećoj tabeli.
165
Statistika u ekonomiji i menadžmentu
Tabela 4.9. Broj diplomiranih studenata na E.F., bazni i lančani indeksi Godine 1998 1999 2000 2001 2002 Ukupan broj studenata 581 484 532 665 462 Žene 345 273 310 373 275 Procenat žena po godinama 59,38% 56,40% 58,27% 56,09% 59,52% Bazni indeksi (1998) - Ukupno 100 83,30 91,57 114,46 79,52 83,30 109,92 125,00 69,47 Lančani indeksi -Ukupno 100 79,13 89,86 108,12 79,71 Bazni indeksi (1998) - Žene 79,13 113,55 120,32 73,73 Lančani indeksi - Žene Izvor: Statistički godišnjak Bosne i Hercegovine 2005., Federalni zavod za statistiku, Sarajevo, str. 295.
Na sljedećim grafikonima smo prezentirali bazne i lančane indekse za ukupan broj studenata, kao i bazne i lančane indekse za žene. 120 110 100 90
114.46 100 91.57
80
83.30
79.52
70 60
1998
Grafikon 4.10.
166
1999
2000
2001
2002
Bazni indeksi ukupnog broja studenata sa bazom u 1998. godini
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
130 120 110 100
1998
2001 1999
90
2000
80 70
2002
60 50 Grafikon 4.11.
Lančani indeksi ukupnog broja studenata u periodu od 1998. do 2002. g.
120 108,12
110 100
100
90 89,86
80 70 60
79,71
79,13
1998
Grafikon 4.12.
1999
2000
2001
2002
Bazni indeksi broja studentica sa bazom u 1998.g.
167
Statistika u ekonomiji i menadžmentu
130 120 110 100
1998 1999
90
2000
2001 2002
80 70 60 50 Grafikon 4.13.
Lančani indeksi broja studentica u periodu od 1998. do 2002. godine
Primjer 4.2. Na osnovu podataka datih u tabeli 4.10.a. izračunati i grafički predstaviti bazne indekse (baza 1997. godina), lančane indekse i prosječnu godišnju stopu promjene društvenog proizvoda Bosne i Hercegovine u periodu 19972001. Tabela 4.10.a. Društveni bruto proizvod BiH u milionima KM
DBP
1997.
1998.
1999.
2000.
2001.
6367
7244
8604
9611
10480
Izvor: Statistički bilten broj 1., Agencija za statistiku BiH, 2003., str. 20.
Bazni indeksi su predstavljeni u sljedećoj tabeli i grafikonima.
8604 ⋅100 = 135,13 . Stopa rasta DBP između 1997. i 6367 1999. je bila 35,13%. Naprimjer: I 99 / 97 =
168
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.10.b. Bazni indeksi za društveni bruto proizvod BiH u milionima KM
180 160 140 120 100 80 60 40 20 0
I 97
I 98/97
I 99/97
I 00/97
I 01/97
100
113,77
135,13
155,95
164,60
135,13 100,00
1997
150,95
164,60
113,77
1998
1999
2000
2001
Grafikon 4.14. Bazni indeksi DBP BiH baza 100 u 1997. godini
180 160 140 120 100 80 60 40 20 0
1997
Grafikon 4.15.
1998
1999
2000
2001
Bazni indeksi DBP BiH baza 100 u 1997. godini
Na osnovu podataka iz tabele 4.10.a. izračunali smo seriju lančanih indeksa društvenog proizvoda Bosne i Hercegovine baza 100 u periodu (t-1).
169
Statistika u ekonomiji i menadžmentu
I 99 / 98 =
8604 ⋅100 = 118,77 7244
Tabela 4.10.c. Lančani indeksi za društveni bruto proizvod BiH u milionima KM
I 97/96
I 98/97
I 99/98
I 00/99
I 01/00
-
113,77
118,77
111,70
109,04
120
115
118,77
113,77 111,7 109,04
110
105
1998/97
Grafikon 4.16.
1999/98
2000/99
2001/00
Lančani indeksi DBP BiH baza 100 (t-1)
Primjer 4.3. U narednoj tabeli i grafikonu predstavljamo podatke o indeksima cijena na malo i indeksima troškova života u Federaciji BiH. Tabela 4.11. Indeksi cijena na malo u Federaciji BiH 1999 1998
2000 1999
2001 2000
2002 2001
2003 2002
2004 2003
Indeksi cijena na malo
99,1
101,2
101,7
99,8
100,2
99,7
Indeksi troškova života
99,3
101,4
102,1
101,0
100,6
100,0
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str. 260. i 262.
170
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Indeksi cijena na malo Indeksi troškova života
103 102 101 100 99 98
1999/98
2000/99
Grafikon 4.17.
2001/00
2002/01
2003/02
2004/03
Indeksi cijena i troškova života
4.2.2. Osobine indeksa
•
Indeks ostaje nepromijenjen ako se posmatrana veličina ne mijenja. Ova osobina se naziva osobina identiteta. Ako je Vt=V0, odgovarajući indeksi ostaju nepromijenjeni tj. it/0= i0/0=1
•
(4.8)
Osobina tranzitivnosti je izražena sljedećom relacijom:
it / 0 = it / t ' ⋅ it ' / 0 =
Vt Vt ' Vt ⋅ = Vt ' V0 V0
(4.9)
Ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak odnosu veličine pojave u posmatranom i baznom periodu. Ova osobina se može generalizirati na seriju sukscesivnih indeksa. Naprimjer, vrijednost indeksa u periodu t = 4 u odnosu na bazni period 0 (i4/0) je jednaka proizvodu uzastopnih indeksa u prethodnim periodima:
i4 / 0 = i4 / 3 ⋅ i3 / 2 ⋅ i2 / 1 ⋅ i1 / 0 =
V4 V3 V2 V1 V4 ⋅ ⋅ ⋅ = V3 V2 V1 V0 V0
171
Statistika u ekonomiji i menadžmentu
Koristeći izraz:
it / t ' =
it / 0 it ' / 0
(4.10)
možemo porediti posmatranu veličinu u periodima t i t’. • Osobina recipročnosti se može definisati u odnosu na vrijeme. Ova osobina kaže da je recipročan indeks neutralan u odnosu na vrijeme. To znači da se promjena baznog datuma predstavlja inverznom formulom:
it / 0 =
1 i0 / t
⇒ it / 0 ⋅ i 0 / t = 1
(4.11)
Za t =1 gornja formula ima sljedeći oblik:
i1 / 0 =
1 i0 / 1
⇒ i1 / 0 ⋅ i0 / 1 = 1
(4.12)
Inverzijom baznog i tekućeg perioda ostvaruje se recipročnost indeksa. Recipročnost indeksa ne znači da su procenti rasta i opadanja identični. Posmatrajmo indeks čija je vrijednost jednaka 1 u baznom i 1,5 u periodu 1:
i1 / 0 = i0 / 1 =
V1 1,5 = = 1,5 V0 1 1 i1 / 0
=
1 = 0,67 1,5
Rast između datuma 0 i 1 je 50%. Opadanje između 1 i 0 je 33%.
•
Osobina cirkularnosti. Kada su zadovoljene osobine tranzitivnosti i recipročnosti definisana je i osobina cirkularnosti:
it / t ' ⋅ it '/ 0 ⋅ i0 / t = it / 0 ⋅ i0 / t = 1, odnosno Vt Vt ' V0 Vt ⋅ ⋅ = =1 Vt ' V0 Vt Vt ili
172
(4.13)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
i2 /1 ⋅ i1/ 0 ⋅ i0 / 2 = i2 / 0 ⋅ i0 / 2 = 1, odnosno (4.14)
V2 V1 V0 V2 ⋅ ⋅ = =1 V1 V0 V2 V2
Na osnovu tranzitivnosti, proizvod prva dva člana je jednak i2/0. Na osnovu recipročnosti i2/0 × i0/2=1.
Primjer 4. 4. Primjena osobina indeksa na primjeru iz tabele 4.7. za visoku stručnu spremu (VSS) i ukupan broj nezaposlenih:
VSS Ukupno
I 99/98
I 00/99
I 01/00
I 01/98
92,42
108,27
106,66
106,73
102,07
99,99
102,76
104,88
Da bismo izračunali indeks nezaposlenih VSS u periodu od 1998. do 2001. godine na osnovu lančanih indeksa za prethodne tri godine primijenićemo osobinu tranzitivnosti indeksa:
i01 / 98 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 =
V01 V00 V99 V01 ⋅ ⋅ = V00 V99 V98 V98
i01/ 98 = 1,0666 ⋅1,0827 ⋅ 0,9242 = 1,0673 I 01/ 98 = i01/ 98 ⋅100 = 106,73 Primjenom osobine tranzitivnosti smo izračunali i indeks ukupnog broja nezaposlenih u istom periodu i rezultat upisali u gornju tabelu.
•
Primjena indeksa u izračunavanju stope promjene
Stopu promjene smo definisali sljedećim izrazom:
ΔV Vt − V0 Vt = = −1 V V0 V0
173
Statistika u ekonomiji i menadžmentu
Pošto je indeks na bazi 1 jednak it / 0 =
Vt izraz za stopu promjene možemo V0
napisati na sljedeći način:
ΔV Vt − V0 Vt = = − 1 = it / 0 − 1 V V0 V0
(4.15)
Stopa promjene koju možemo označiti sa s je jednaka razlici između indeksa u bazi 1 jedinice:
s=
ΔV = it / 0 − 1 V
(4.16)
Indeks u bazi 1 je jednak zbiru stope promjene i jedinice. Pošto stope promjene ne posjeduju osobine računanja, u izračunavanju stopa potrebno je koristiti indekse u bazi 1, a konačni rezultat se može izraziti ili u bazi 100, ili kao stopa promjene u procentima. Na osnovu izračunatih relativnih promjena broja nezaposlenih osoba visoke stručne spreme (u %) u Federaciji BiH prezentovanih u tabeli 4.6. izračunat ćemo stopu promjene broja nezaposlenih u periodu 1998/2001. Dakle, na osnovu sljedećih podataka
VSS
1999/98
2000/99
2001/00
-7,58
8,27
6,66
2001/98
ćemo izračunati traženu stopu. Kako stope promjene nemaju nikakvu osobinu računanja potrebno je primijeniti indekse na bazi 1. Na osnovu podataka iz gornje tabele, računamo proste indekse za tri posmatrana perioda. Prvo stope promjene izrazimo u obliku decimalnih brojeva, a zatim primijenimo vezu prema kojoj je indeks u bazi 1 jednak stopi promjene uvećanoj za jedinicu. Ovim postupkom smo dobili sljedeće rezultate:
i99 / 98 = −0,0758 + 1 = 0,9242 i00 / 99 = 0,0827 + 1 = 1,0827 i01 / 00 = 0,0666 + 1 = 1,0666 174
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Primjenom osobine tranzitivnosti računamo indeks za traženi period:
i01/ 98 = i99 / 98 ⋅ i00 / 99 ⋅ i01/ 00 = 0,9242 ⋅1,0827 ⋅1, 0666 = 1, 06727 ≈ 1, 0673 Da bismo izračunali stopu promjene, broja nezaposelnih u periodu 19982001, koristiti ćemo vezu između indeksa i stope promjene. U ovom primjeru stopa promjene je jednaka indeksu u bazi jedan umanjenom za jedinicu: 1,0673-1=0,0673. Ako rezultat želimo izraziti u procentima pomnožićemo ga sa 100. U periodu između 1998. i 2001.g., broj nezaposelnih sa visokom stručnom spremom se povećao za 6,73%. Stope promjene se ne mogu sabirati. Zbir stopa promjene u uzastopnim periodima ne daje stopu promjene u periodu koji sadrži te uzastopne periode. Npr. stope promjene od –7,58 zatim 8,27 i 6,66 ne uvećavaju nezaposlenost za 7,35% = (–7,58 + 8,27 + 6,66) nego kao što smo izračunali za 6,73%.
•
Prosječna godišnja stopa promjene
Pretpostavimo da veličina V raste po godišnjoj stopi r. Označimo njenu vrijednost u periodu 1, dakle, u polaznoj godini, sa V1. Godinu poslije vrijednost veličine V će biti jednaka: V2 =V1 + V1 · r = V1 (1+r)
(4.17)
Ako se rast nastavi po istoj stopi, u periodu 3 ćemo imati: V3 =V2 + V2 ·r = V2 (1+r) = V1 (1+r)2
(4.18)
Poslije t godina veličina će biti jednaka: Vt = V1 (1+r)t-1
(4.19)
(1 + r )t −1 = (1 + r ) = t −1 r = t −1
Vt V1
Vt V1
(4.20)
Vt − 1 = t −1 it /1 − 1 V1 175
Statistika u ekonomiji i menadžmentu
Vt se naziva prosječan indeks promjene i predstavlja geometrijsku V1 sredinu lančanih indeksa. Prosječna godišnja stopa promjene je jednaka prosječnom godišnjem indeksu promjene umanjenom za jedinicu. Ukoliko stopu promjene želimo izraziti u procentima, izraz za stopu promjene ćemo pomnožiti sa 100: Izraz
t −1
⎛ V ⎞ r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎝ V1 ⎠
(
t −1
)
it /1 − 1 ⋅100
(4.21)
Prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa umanjenoj za jedinicu. Ova formula može biti korištena direktno ukoliko poznajemo prosječni godišnji indeks ili vrijednosti posmatrane varijable u posmatranim periodima10. Izraz za prosječnu godišnju stopu možemo napisati i u razvijenom obliku:
⎛ V ⎞ ⎛ V V ⎞ V r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎜⎜ t −1 t ⋅ t -1 ⋅⋅⋅ 2 − 1⎟⎟ ⋅100 ⎝ V1 ⎠ ⎝ Vt -1 Vt -2 V1 ⎠
( =( =
Izraz (1 + r )t −1 =
)
t −1
it / t -1 ⋅ it −1/ t − 2 ⋅⋅⋅ i2 /1 − 1 ⋅100
t −1
it /1 − 1 ⋅100
)
(4.22)
Vt možemo korištenjem logaritama izraziti u sljedećem V1
obliku:
(t − 1) ⋅ log (1 + r ) = log log (1 + r ) =
10
Vt V1
log Vt − log V1 t −1
Ovu vrijednost može biti izračunata direktno korištenjem digitrona ili primjenom logaritama.
176
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
⎛ log Vt − log V1 ⎞ (1 + r ) = anti log ⎜ ⎟ t −1 ⎝ ⎠ ⎛ log Vt − log V1 ⎞ r = anti log ⎜ ⎟ −1 t −1 ⎝ ⎠
(4.23)
i izračunati korištenjem logaritama. Period t za koji bi se dostigao planirani nivo veličine V se izračunava na sljedeći način:
r = t −1
Vt −1 V1
r + 1 = t −1
Vt V1
log(r + 1) = t=
1 (log Vt − log V1 ) t −1
(log Vt − log V1 ) log(r + 1)
+1
(4.24)
Primjer 4.5. Da bismo na osnovu podataka iz tabele 4.10. izračunali prosječnu godišnju stopu promjene društvenog proizvoda BiH u periodu 1997.-2001. potrebno je prvo izračunati indekse na bazi 1, a zatim izračunati prosječan godišnji indeks u periodu 1997.-2001. i na osnovu tog podatka, izračunati prosječnu godišnju stopu promjene. Godišnji indeks u periodu 1997.-2001. je jednak:
i01 / 97 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 i01/ 97 = 1,0904 ⋅1,1170 ⋅1,1877 ⋅1,1377 = 1,646 Prosječni godišnji indeks dobijamo na sljedeći način:
i = 4 1,6460 = 1,64601/ 4 = 1,1327
177
Statistika u ekonomiji i menadžmentu
Prosječni godišnji indeks je 1,1327. Prosječna godišnja stopa rasta je bila 13,27%. Dakle, prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa (baza 1) umanjenoj za jedinicu za posmatrani period: r01 / 97 = 4 i01 / 97 − 1 = 4 i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 = 4 1,0904 ⋅ 1,1170 ⋅ 1,1877 ⋅ 1,1377 − 1 = 4 1,6460 − 1 = 1,1327 − 1 = 0,1327
Prosječna godišnja stopa rasta društvenog proizvoda u periodu 1997.-2001. godina je bila 13,27%. Utvrđivanje prosječne godišnje stope promjene r možemo formalizirati i na sljedeći način:
r = 4 i01/ 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 =
4
V01 V00 V99 V98 ⋅ ⋅ ⋅ −1 V00 V99 V98 V97
=
4
V01 − 1 = 4 i01/ 97 − 1 V97
= 4 1, 646 − 1 = 1,1327 − 1 = 0,1327 Primjer 4.6. Odrediti prosječnu godišnju stopu promjene ako agregatni pokazatelj V raste 10% prve godine, 20% druge, 25% treće i 40% četvrte godine.
Vt = V1 (1 + r )
t −1
= V1 (1 + r )
4
Vt = V1 (1 + 0,1) ⋅ (1 + 0, 2 ) ⋅ (1 + 0, 25) ⋅ (1 + 0, 40 )
(1 + r )4 = (1,1) ⋅ (1,2) ⋅ (1,25) ⋅ (1,40) = 2,31 (1 + r ) = 4 2,31 = 2,311 / 4
(1 + r ) = 1,23 r = 0,23 178
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
ili
log(1 + r ) =
log 2,31 = 0,0909 4
(1 + r ) = anti log 0,0909 (1 + r ) = 1,23 r = 0,23 r = 23% Prosječna godišnja stopa rasta je bila 23%.
Primjer 4.7. Veličina V se uvećala u prvoj godini 20%, a u drugoj godini se smanjila za 20%. a) Koliko se veličina V promijenila u toku dvije godine? b) Kolika je prosječna godišnja stopa promjene? c) Ako se veličina V uvećala za 20% prve godine, koliko treba da se promijeni u drugoj godini da bi dostigla nivo iz prve godine? a) V2 = V1 ⋅ (1 + 0, 2 )
V3 = V2 ⋅ (1 − 0, 2 ) = ⎡⎣V1 ⋅ (1 + 0, 2 ) ⋅ (1 − 0, 2 ) ⎤⎦ V3 = V1 ⋅ (1, 2 ) ⋅ ( 0,8 ) = V1 ⋅ 0,96 Veličina V je opala za 4% u toku dvije godine. b) V3 = V1 (1 + r )
2
(1 + r )2 = 0,96 1 + r = 0,9798 r = -0,0202 r = -2,02% Prosječna godišnja stopa promjene je jednaka -2,2%. 179
Statistika u ekonomiji i menadžmentu
Ili r = i2 /1 ⋅ i1/ 0 − 1 = 0,8 ⋅ 1,2 − 1 = 0,96 − 1 = 0,9798 − 1 = −0,0202 r = −2,02%
c) V3 = V2 (1 + r )
V2 = V1 ⋅1, 20 Slijedi:
V3 = V1 ⋅1, 20 ⋅ (1 + r ) ⇒ 1, 20 ⋅ (1 + r ) = 1 ⇒ (1 + r ) =
1 20
1 −1 1,20 r = −0,1666 r=
Poslije povećanja od 20% V se mora smanjiti za 16,66% da bi dostigao svoj nivo iz baznog perioda.
Primjer 4.8. U periodu 1993.-2002. stopa poreza je rasla u apsolutnom iznosu 1% svake godine, a u 2003. i 2004. godini je rasla za 0,5% godišnje. U 2005.g. je opala za 1%. U 2002. stopa poreza je bila 44%. a) Izračunati prosječnu godišnju stopu poreza između 1993. i 2005. b) U kojoj godini bi ova stopa bila veća od 50%?
Rješenje: a) U 1993: 0, 44 − 0, 09 = 0,35 U 2004: 0,44 + 0,01 = 0,45 U 2005: 0,45 − 0,01 = 0,44
r = 12
0, 44 − 1 = 12 1, 2571 − 1 = 1, 0193 − 1 ⇒ r = 1,93% 0,35
b) U 2005.g. r = 44%. Ova stopa će biti veća od 50%, t godina poslije 2005.g. ako se uvećava po prosječnoj stopi od 1,93% godišnje.
180
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
0, 44 ⋅ (1, 0193)
(1, 0193) t −1 =
t −1
=
t −1
= 0,50
0,50 = 1,1364 0, 44
log1,1364 = 6, 68 ⇒ t = 7, 78 ≈ 8 godina log1, 0193
Stopa bi bila veća od 50% u 2013. godini.
Primjer 4.9. Veličina V je rasla po istoj stopi u toku 3 godine. U 2002. je bila 2000 €, a u 2005. 2662 €. Koja je bila prosječna godišnja stopa rasta?
r = t −1
Vt 2662 −1 = 3 −1 V1 2000
r = 3 1,331 − 1 = 1,1 − 1 = 0,10 r = 10% ili
log 2662 − log 2000 3 log(1 + r ) = 0,04139 (1 + r ) = anti log 0,04139 log(1 + r ) =
(1 + r ) = 1,10 ⇒ r = 0,10 ⇒ 10% 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne Lančani indeksi se pretvaraju u bazne postupkom postepenog množenja indeksa prema sljedećem izrazu:
⎧100, t = b = 1 It /0 = ⎨ ⎩ I ( t −1) / 0 ⋅ it /( t −1) , t = 2,3,.., n.
(4.25)
181
Statistika u ekonomiji i menadžmentu
Lančani indeksi mogu se pretvarati u indekse na stalnoj bazi vezanoj za bilo koji period primjenom sljedeće relacije: ⎧100, t = b ⎪ ⎪ I (t +1) / 0 (4.26) It /0 = ⎨ ,t b U prethodnom izrazu b je bazni period i za t = b indeks je jednak 100. Bazne indekse za prethodne periode dobijamo dijeleći bazni indeks naredne sa lančanim indeksom te iste godine. Bazni indeksi za naredne periode dobiju se postupnim množenjem baznog indeksa iz prethodnog i lančanog indeksa iz posmatranog perioda. 4.2.3.2. Pretvaranje baznih u lančane indekse Pošto su indeksi na stalnoj bazi upravo proporcionalni orginalnim podacima, u postupku pretvaranja baznih u lančane indekse postupa se kao da se radi sa izvornim podacima. Indeksi na stalnoj bazi pretvaraju se u lančane tako da se indeks iz tekućeg perioda dijeli sa prethodnim indeksom i rezultat pomnoži sa 100.
I t /(t −1) =
It / 0 I (t −1) / 0
⋅ 100, t = 2,3,.., n.
(4.27)
Pri pretvaranju baznih u lančane indekse nije bitno koji period ćemo izabrati za bazno razdoblje. 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu Indeksi na stalnoj bazi preračunavaju se na drugu bazu tako da se svaki indeks podijeli indeksom novog baznog razdoblja i dobijeni odnos pomnoži sa 100.
I t*/ 0 =
182
It / 0 ⋅ 100 I b* / 0
(4.28)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Dva najčešća razloga promjene baze indeksa su potreba poređenja različitih varijabli (DBP, nezaposlenost, itd.) čiji objavljeni indeksi su rijetko izraženi na osnovu iste baze i periodično usklađivanje baza kada je potrebno reaktualizirati bazu ako se serija previše udaljava od orginalne vrijednosti. U ovom slučaju koristi se osobina tranzitivnosti it / 0 = it /1 ⋅ i1/ 0 ⇒ it /1 =
it / 0 . i1/ 0
Novi indeks je jednak količniku između polaznog baznog indeksa i indeksa nove bazne godine izraženog u staroj bazi 0.
Primjer 4.10. Lančani indeksi industrijske proizvodnje Federacije BiH su predstavljeni u sljedećoj tabeli: Tabela 4.12. Lančani indeksi industrijske proizvodnje Federacije BiH
I96/95
I97/96
I98/97
I99/98
I00/99
I01/00
187,6
135,7
123,8
110,6
108,8
112,2
Izvor: Statistički godišnjak Federacije BiH, 2002, str.113.
Na ovom primjeru ćemo ilustrovati pretvaranje lančanih u bazne indekse uz pretpostavku da je baza 100 u 1998. godini. Tabela 4.12.a. Pretvaranje lančanih u bazne indekse 1995.
1996.
1997.
1998. 1999.
2000.
2001.
Postupak 59,5/1,876 80,8/1,357 100/1,238 100
110,6 110,6⋅1,088 120,3⋅1,122⋅
Indeksi
110,6
31,7
59,5
80,8
100
120,3
134,97≈135
4.2.4. Agregatni indeksi Najznačajniji agregatni indeksi su: indeks vrijednosti, indeks cijena, indeks fizičkog obima proizvodnje, indeksi troškova života, itd. Konstrukciju agregatnih indeksa ćemo ilustrovati na primjeru potrošnje dva proizvoda. 183
Statistika u ekonomiji i menadžmentu
Tabela 4.13. Cijena proizvoda A i B
2004. 2005.
Proizvod A Cijena KM/kom 4 6
Proizvod B Cijena KM/kom 10 11
Na osnovu datih podataka možemo izračunati samo individualne indekse cijena svakog proizvoda gdje je 2004. bazna godina.
IpA =
6 ⋅ 100 = 150 4
IpB =
11 ⋅ 100 = 110 10
Konstatujemo da se cijena proizvoda A povećala za 50%, a cijena proizvoda B za 10% u posmatranom periodu. Ako gornju tabelu kompletiramo sa podacima o kupljenim količinama svakog proizvoda: Tabela 4.14. Cijena i kupljena količina proizvoda A i B Proizvod A
2004. 2005.
Cijena KM/kom 4 6
Komad 10 12
Proizvod B
Cijena KM/kom 10 11
Komad 8 10
Možemo izračunati za svaku godinu budžet utrošen za kupovinu tih proizvoda: Budžet u 2004.:
4 KM / kom ⋅ 10kom + 10 KM / kom ⋅ 8kom = 40 KM + 80 KM = 120 KM Budžet u 2005.:
6 KM / kom ⋅ 12kom + 11KM / kom ⋅ 10kom = 72 KM + 110 KM = 182 KM 184
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
i izračunati sljedeći indeks vrijednosti:
IW 05 / 04 =
W05 182 = ⋅ 100 = 151, 67 W04 120
na osnovu kojeg konstatujemo da se budžet potrošača utrošen na kupovinu dva posmatrana proizvoda povećao za 51,67% u 2005. u odnosu na 2004. godinu. 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja Da bismo objasnili konstrukciju agregatnih indeksa cijena metodom agregiranja formalizaciju ćemo predstaviti na sljedeći način: Tabela 4.15. Konstrukcija agregatnih indeksa cijena
(i=0) (i=1)
Proizvod A (j)=1 Proizvod B (j)=2 Vrijednost potrošačke Cijena KM/kom Komad Cijena KM/kom Litar pi(1) pi(2) qi(2) korpe (W) qi(1) 2004. 4 10 10 8 120 2005. 6 12 11 10 182
U gornjoj tabeli smo uveli sljedeće simbole: p je cijena, q je količina, i je indeks datuma, a j indeks proizvoda, bazna godina je 2004. (i=0) i posmatrana godina 2005. (i=1). Potrošnja u 2004.: (i=0) 2
∑ p0 q0 = ∑ p0( j ) q0( j ) = p10 q10 + p02 q02 = 4 ⋅ 10 + 10 ⋅ 8 = 120 j =1
Potrošnja u 2005.: (i=1) 2
∑pq =∑p 1 1
j =1
( j) ( j) 1 1
q
= p11 q11 + p12 q12 = 6 ⋅ 12 + 11 ⋅ 10 = 182
Indeks vrijednosti ćemo označiti sa IW i izračunati na sljedeći način: 185
Statistika u ekonomiji i menadžmentu
IW 1/ 0 =
∑pq ∑p q
1 1
⋅ 100 =
0 0
182 ⋅ 100 = 151, 67 120
Indeks vrijednosti mjeri evoluciju cijena i kupljenih količina. Budžet utrošen za kupovinu ova dva proizvoda se povećao za 51,67%. Da bismo izračunali indeks cijena možemo fiksirati strukturu potrošnje u baznom ili u posmatranom periodu. •
Struktura potrošnje (količina) fiksirana u baznom periodu
Ako strukturu potrošnje fiksiramo u 2004. godini (bazni datum) dobijamo Laspeyres (Lasperov) indeks cijena:
L p1/ 0 =
∑pq ∑p q
1 0
⋅ 100 =
0 0
=
p11 q01 + p12 q02 ⋅ 100 = p10 q01 + p02 q02
6 ⋅ 10 + 11 ⋅ 8 148 ⋅ 100 = ⋅ 100 = 123,33 120 120
148 KM je fiktivna vrijednost koju bi imala potrošačka korpa u 2005. ako bi potrošnja ostala ista kao u 2004. Laspeyres indeks cijena u 2005. baza 100 u 2004. je jednak 123,33. Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,33% u posmatranom periodu. •
Struktura potrošnje (količina) fiksirana u posmatranom periodu
Ako strukturu potrošnje fiksiramo u posmatranom periodu, tj. u 2005. godini, dobijamo Paasche (Pašev) indeks cijena:
Pp1/ 0 =
∑pq ∑p q
1 1 0 1
=
⋅ 100 =
p11 q11 + p12 q12 ⋅ 100 = p01 q11 + p02 q12
6 ⋅ 12 + 11 ⋅ 10 182 ⋅ 100 = ⋅ 100 = 122,97 4 ⋅ 12 + 10 ⋅ 10 148
148 KM je fiktivna vrijednost koju bi imala potrošačka korpa ako bi u 2004.g. potrošnja bila jednaka potrošnji u 2005.g. Paasche indeks cijena potrošnje u 2005.g. baza 100 u 2004.g. je jednak 122,97. Na osnovu ovog indeksa konstatujemo povećanje cijena od 22,97%. 186
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Indeks izračunat na bazi ponderacija iz posmatranog perioda je najčešće manji od indeksa utvrđenog na osnovu ponderacija iz baznog perioda. 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina Laspeyres i Paasche indeks možemo formalizirati koristeći ponderisane sredine.
•
Laspeyres indeks možemo izraziti u obliku aritmetičke sredine na sljedeći način:
L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 ( j)
gdje α 0( j ) predstavlja realni budžetski koeficijent (ponder) proizvoda (j) utvrđen u baznom periodu 0. Dobijamo ga kao odnos realne potrošnje za svaki proizvod u baznom periodu i realne vrijednosti potrošačke korpe u baznom periodu. Za proizvod A (j=1):
α 0(1) =
p 01 ⋅ q01 4 ⋅ 10 = = 0,33 1 1 2 2 120 p0 ⋅ q0 + p0 ⋅ q0
Za proizvod B (j=2):
α 0( 2) =
p 02 ⋅ q 02 80 = = 0,67 1 1 2 2 p 0 ⋅ q 0 + p 0 ⋅ q 0 120
α 0(1) + α 0( 2) = 0,33 + 0,67 = 1 L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 = α 01 ⋅ I 1p1 / 0 + α 02 ⋅ I p21 / 0 ( j)
= 0,33 ⋅ I pA + 0,67 ⋅ I pB
= 0,33 ⋅ 150 + 0,67 ⋅ 110 = 123,2 Dobili smo isti rezultat kao sa agregatnim oblikom Laspeyres indeksa cijena. 187
Statistika u ekonomiji i menadžmentu
•
Paasche indeks u obliku aritmetičke sredine
j) Pp 05 / 04 = ∑ β 01( j ) ⋅ I p( 05 / 04 ( j)
β 01( j ) je fiktivni budžetski koeficijent proizvoda (j) računat na osnovu cijena iz baznog perioda i količina iz posmatranog perioda. Dobijamo ga kao odnos fiktivne potrošnje svakog proizvoda i fiktivne vrijednosti potrošačke korpe. Za proizvod A (j=1):
β
1 p = 0 , q =1
p01 ⋅ q11 48 = 1 1 = = 0,32 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148
β p2=0,q =1 =
p 02 ⋅ q12 100 = = 0,68 1 1 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148
Pp 05 / 04 = β 1p =0,q =1 ⋅ I 1p + β p2=0,q =1 ⋅ I p2 = 0,32 ⋅ 150 + 0,68 ⋅ 110 = 122,8 Dobili smo naravno isti rezultat kao sa agregatnim oblikom Paasche indeksa cijena. Na osnovu izračunatih indeksa možemo posmatrati evoluciju strukture potrošnje. Realne proporcije u 2004.g. su sljedeće: 33% budžeta je utrošeno za proizvod A (indeks cijena: 150) i 67% budžeta je utrošeno za proizvod B (indeks cijena: 110). Realne proporcije u 2005.g. su: 40% budžeta je utrošeno za proizvod A i 60% budžeta je utrošeno za proizvod B. 4.2.4.3. Formule za računanje i osobine agregatnih indeksa
•
Formule za agregatne indekse dobijene metodom agregiranja su sljedeće: -
Agregatni indeksi cijena
1. Laspeyres:
L p1/ 0 = 100 ⋅
∑pq ∑p q
1 0 0 0
količina je fiksirana u baznom periodu. 188
(4.29)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
2. Paasche:
Pp1/ 0 = 100 ⋅
∑pq ∑pq
1 1
(4.30)
0 1
količina je fiksirana u posmatranom periodu.
-
Agregatni indeksi količina
1. Laspeyres:
Lq1/ 0 = 100 ⋅
∑p q ∑p q
0 1
(4.31)
0 0
cijene su fiksirane u baznom periodu. 2. Paasche:
Pq1/ 0 = 100 ⋅
∑pq ∑pq
1 1
(4.32)
1 0
cijene su fiksirane u posmatranom periodu.
•
Formule dobijene na osnovu ponderisanih sredina -
Agregatni indeks cijena
1. Laspeyres:
L p1/ 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0
(4.33)
( j)
Laspeyres indeks cijena je jednak aritmetičkoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu baznog perioda. 2. Paasche:
Pp1/ 0 =
1
∑α ( j)
( j) 1
⋅
1
(4.34)
I p( 1j )/ 0 189
Statistika u ekonomiji i menadžmentu
Paasche indeks cijena je jednak harmonijskoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu posmatranog perioda.
•
Agregatni indeksi količina
Agregatne indekse količina definišemo sljedećim izrazima: 1. Laspeyres: Lq1/ 0 = ∑ α 0( j ) ⋅ I q(1j/)0
(4.35)
( j)
2. Paasche:
Pq1/ 0 =
1
∑α
( j) 1
( j)
•
⋅
1
(4.36)
I q(1j/)0
Osobine agregatnih indeksa
Laspeyres indeksi koji se izračunavaju kao ponderisana aritmetička sredina imaju osobinu agregiranja. Teorijski ni indeksi Laspeyres, ni indeksi Paasche nemaju osobinu tranzitivnosti. U praksi se, zbog činjenice da je ova osobina numerički skoro zadovoljena, pretpostavlja da i ovi indeksi zadovoljavaju osobinu tranzitivnosti da bi se pojednostavila njihova primjena.
Primjer 4.11. Indeks troškova života 2000./1999. u Federaciji BiH je jednak:
itž 00/99 = 1,014 Indeks troškova života 2001./2000. u Federaciji BiH je jednak:
itž 01/00 = 1,021 Konstatujemo da je: itž 01/99 = 1,014 ⋅1,021 = 1,035 Dakle, stopa inflacije u periodu od dvije godine je jednaka 3,5% U statističkoj praksi se za određivanje indeksa cijena koristi najčešće Laspeyres indeks. Federalni zavod za statistiku BiH i Agencija za statistiku BiH koriste Laspeyres indeks za utvrđivanje cijena. 190
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
4.2.4.4. Fischerov indeks cijena Fischerov indeks cijena je jednak geometrijskoj sredini Laspeyres i Paasche indeksa cijena:
F p 1 / 0 = L p 1 / 0 ⋅ Pp 1 / 0
(4.37)
Ako uvrstimo Laspeyres i Paasche indeks cijena iz našeg primjera, dobijamo Ficherov indeks cijena.
F p 03 / 02 = 123,33 ⋅ 122,97 = 123,15 Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,15% 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija Agregatni indeks vrijednosti je definisan sljedećim izrazom:
IW1 / 0 =
∑pq ∑p q
1 1
⋅ 100
(4.38)
0 0
Agregatni indeks vrijednosti možemo dekomponovati na sljedeći način:
iW1 / 0 =
∑pq ∑p q
1 1
=
0 0
∑pq
1 1
X
⋅
X = ∑ p0 q0
∑pq ⋅∑p q ∑p q ∑p q
Y = ∑ p0 q0
∑pq ⋅∑pq ∑pq ∑p q
1 1
0 1
0 1
0 0
iW1 / 0 = pp.lq(4.39) iW1 / 0 =
∑pq ∑p q
1 1
=
0 0
iW1 / 0 = pq .lp
∑pq
1 1
Y
⋅
1 1
1 0
1 0
0 0
(4.40)
Primjena na našem primjeru:
lq1/ 0 =
∑p q ∑p q
0 1
0
0
=
4 ⋅ 12 + 10 ⋅ 10 148 = = 1,233 120 120
191
Statistika u ekonomiji i menadžmentu
pq1/ 0 =
∑pq ∑pq
1 1
1 0
=
182 59 = = 1,230 6 ⋅ 10 + 11 ⋅ 8 50
iW = l p ⋅ pq = 1, 233 ⋅ 1, 230 = 1,52 Povećanje od 52 % vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23,3% i povećanja kupljene količine za 23%.
iW = p p ⋅ lq = 1, 23 ⋅ 1, 233 = 1,52 Povećanje od 52% vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23% i povećanja kupljene količine za 23,3%. 4.2.4.6. Inflacija i deflator Inflacija je ekonomska neravnoteža koja se manifestuje konstantnim povećanjem cijena. Porast cijena, koji je simptom inflacije, se mjeri pomoću indeksa troškova života koji računaju i objavljuju zvanične statističke institucije. Indeks troškova života za 2001./2000. u Federaciji BiH je bio jednak itž 01/00 = 1,021 . To znači da je stopa rasta troškova života u periodu 2000.-2001. bila 2,1%. Deflator je statistički indikator pomoću kojeg eliminišemo uticaj inflacije koja vještački povećava vrijednost proizvoda i usluga. Deflator nam omogućava da veličine izražene u tekućim cijenama izrazimo u stalnim cijenama. Na sljedećem primjeru ćemo ilustrovati primjenu deflatora. Tabela 4.16. Prosječne godišnje neto plate u Federaciji BiH
Prosječne godišnje neto plate u KM Indeksi troškova života
1997.
1998.
1999.
2000.
2001.
266,33
329,12
374,54
412,72
443,26
106,8
99,3
101,4
102,1
Izvor: Statistički godišnjak Federacije BiH 2001, str. 267., Statistički godišnjak Federacije BiH 2002, str. 271.
192
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Izračunaćemo nominalni i realni indeks plata za period 1997.-1998. i 2000.2001. godina. • U analizi plata kao deflator koristimo indeks troškova života. Prvo ćemo izračunati nominalni indeks plata za 98./97. In plata 98/97=329,12/266,33=123,6.
•
Prema ovom indeksu, plate su se u periodu 97.-98. povećale za 23,6%. Da bismo izračunali realni indeks plata, nominalne indekse plata smo deflacionirali indeksom troškova života. Realni indeks plata 98./97. je jednak: Ir plata 98/97= In / Itž =123,6/106,8=115,7. Prema ovom indeksu plata, za isti period, konstatujemo da su se plate povećale za 15,7%.
Kao deflator se može koristiti i indeks cijena na malo koji računaju i objavljuju zvanične statističke institucije. U opštem slučaju da bismo pokazatelje izražene u tekućim izrazili u stalnim cijenama koristimo odgovarajući deflator. Da bismo dobili stalne cijene, tekuće cijene je potrebno podijeliti sa deflatorom isc=itc /deflator. U slučaju plata u našem primjeru koristili smo kao deflator indeks troškova života isc=itc/itž. Da bismo izrazili realne indekse plata bilo je potrebno podijeliti nominalne indekse plata sa indeksima troškova života ir=in/itž.
4.3. VREMENSKE (HRONOLOŠKE) SERIJE Polaznu osnovu za analizu pojava u vremenu čini vremenska serija. Vremenska serija je skup hronološki utvrđenih vrijednosti neke pojave. Zadaci analize vremenskih serija su: • Opis razvoja pojave u vremenu • Objašnjenje varijacije pojave u vremenu • Predviđanje razvoja pojave.
193
Statistika u ekonomiji i menadžmentu
4.3.1. Konstitutivni elementi vremenske serije Konstitutivni elementi vremenske serije su: dugoročna tendencija ili trend, ciklične varijacije, sezonske promjene i slučajne ili rezidualne promjene.
•
Tendencija ili trend
Trend izražava dugoročnu evoluciju ili osnovni tok kretanja pojave i izražava se funkcijama vremena. Trend predstavlja dugoročnu generalnu tendenciju rasta ili opadanja pojave koja se istražuje. U ekonomiji dugoročna tendencija ima trajanje duže od 10 godina. Ova dugoročna tendencija potiče iz fenomena čiji se efekti manifestuju poslije dugo vremena (rađanje/struktura populacije prema godinama starosti, tehničke promjene/efikasnost osnovnih sredstava itd.). Primjer dugoročne tendencije rasta pokazuje cijene troškova života.
•
Ciklične varijacije
Ciklične varijacije mogu biti različitog intenziteta i trajanja. Njihova periodičnost je od 2 do 10 godina. Uzrok ovih varijacija su uglavnom fluktuacije u tokovima (potrošnja, investicije itd.). Cikličnu komponentu koja predstavlja dugoročne varijacije oko trenda je često teško identifikovati tako da se može smatrati kao dio trenda.
•
Sezonske varijacije
Sezonske varijacije pokazuju sezonski ili periodični uticaj na analiziranu pojavu. Sezonske promjene karakterišu oscilacije regularnog trajanja i intenziteta oko trenda. Periodičnost pojavljivanja sezonskih varijacija je manja ili jednaka godini. Sezonske varijacije se mogu lahko uočiti ukoliko kretanje pojave predstavimo grafički. Tipični primjeri ovog tipa varijacija su: potrošnja električne energije, proizvodnja poljoprivrednih proizvoda, broj noćenja u turizmu, dolazak novih osoba na tržište rada itd.
•
Slučajne ili rezidualne promjene
Slučajne promjene ne možemo objasniti sa tri prethodno analizirane grupe promjena. Slučajne promjene su nepredvidljive i neregularne. Primjer: ratovi, štrajkovi, poplave, požari i druge netipične promjene. 194
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Trend komponenta, ciklične i sezonske promjene se nazivaju sistematskim, determinističkim komponentama jer predstavljaju kovarijacije pojave koje se mogu izraziti funkcijom vremena. Slučajna komponenta je nesistematska. Ona ukazuje na postojanje neregularnih promjena. Vremenska serija ne mora uvijek sadržavati sve navedene komponente. Osnovni zadatak u analizi vremenskih serija je identificiranje, izolovanje i eliminisanje uticaja cikličnih, sezonskih i slučajnih promjena da bi se mogla odrediti dugoročna tendencija posmatrane pojave. Za određivanje dugoročnih tendencija (trenda) promjene pojava predstavljenih vremenskim serijama najčešće koristimo empirijski metod pokretnih sredina i analitički metod najmanjih kvadrata. 4.3.2. Metod pokretnih sredina za određivanje trenda Pokretne sredine reda p (p
View more...
Comments