Seminarski Rad

November 11, 2017 | Author: Faruk Tahmiscija | Category: N/A
Share Embed Donate


Short Description

Download Seminarski Rad...

Description

Internacionalni Univerzitet u Travniku Saobraćajni Fakultet

Seminarski rad iz predmeta STATISTIKA Tema: Vjerovatnoća i statistika

Mentor:

Student:

Doc.dr. Sead Rešić

Faruk Tahmiščija

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Travnik, Juni 2011. godine

2

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

SADRŽAJ

1. UVOD

3

2. VEROVATNOĆA I STATISTIKA

4

3. SREDNJE VRIJEDNOSTI

3

3.1.POJAM, ZNAČAJ I VRSTE SREDNJIH VRIJEDNOSTI

3

3.2.ARITMETIČKA SREDINA

4

3.2.1. Aritmetička sredina iz negrupisanih podataka

4

3.2.2. Aritmetička sredina iz grupisanih podataka

5

3.3. OSOBINE ARITMETIČKE SREDINE

9

3.4. GEOMETRIJSKA SREDINA

10

3.5. HARMONIJSKA SREDINA

11

3.5.1. Harmonijska sredina za negrupisane podatke

12

3.5.2. Harmonijska sredina za grupisane podatke

13

3.6. MEDIJANA

14

3.6.1. Medijana za negrupisane podatke

14

3.6.2. Medijana neintervalnih serija distribucije frekvencija

15

3.6.3. Medijana intervalne serija distribucije frekvencija

17

3.7. MODUS

18

4. ZAKLJUČAK

21

5. INDEKS POJMOVA

22

6.LITERATURA

23

3

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

1. UVOD

U seminarskom radu opisana je analiza podataka – srednje vrijednosti. Ova tema je jedna od bitnih dijelova predmeta Vjerovatnoća i statistika i nalazi veoma široku primenu u svakodnevnom životu. Treba uzeti u obzir da statističke analize datiraj nekoliko vjekova prije naše ere. Prva poznata prebrojavanja sprovedena su u Kini oko 4000 godina i u Egiptu oko 3000 godina prije nove ere, dok su prvi organizovani popisi vršeni u starom vijeku u Rimskoj republici. U početku, osnovni zadatak statističkog istraživanja svodio se na prikupljanje podataka o brojnom stanju stanovnika i vojske, popisi zemljišta i stoke. Obrada ovih podataka se izvodila da bi država imala uvid u svoju vojnu i finansijsku moć. U XVI veku ustanovljeni su u nekim evropskim zemljama i registri rođenih, umrlih i vjenčanih, iz kojih se kasnije razvila statistika prirodnog kretanja stanovništva. Nalazi široku primjenu u raznim oblastima nauke, matematike, programiranja, u svakodnevnom životu, raznim proučavanjima, anketama prilikom ispitivanja stanovništva i u velikim razmjerama u marketingu i menadžmentu. U seminarskom radu objašnjen je postupak definisanja svake srednje vrijednosti, praktični primjeri, kako bi na što lakši način ljudi mogli da razumeju i da shvate srednje vrijednosti i krajnji rezultat u svakom primjeru.

4

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

2. VEROVATNOĆA I STATISTIKA Teorija vjerovatnoće je matematička disciplina koja izučava zakonitosti slučajnih pojava. Prvi problemi koji pripadaju teoriji vjerovatnoće odnose se na izračunavanje različitih mogućnosti vezanih za rezultate pri bacanju kocke i potiču iz 10. i 11. vijeka. Rađanje teorije je vezano za imena Paskala (1623-1662), Ferma (1601-1665) i Hajgensa (1629-1695). Prvu knjigu o teoriji vjerovatnoće “ O računu u hazardnim igrama“ napisao je Hajgens. Razvojem teorije vjerovatnoće moguće je potpuno tačno riješiti problem ocjene slučajnih grešaka. Njemački matematičar Karl Gaus (1777-1855) daje normalni zakon raspodjele slučajnih grešaka zatim ojcenu parametara normalne raspodjele, metod najmanjih kvadrata i slično. Njegovi zadaci iz teorije grešaka se i dan danas nalaze u mnogim udžbenicima, bez izmjena. U drugoj polovini 19. vijeka, u zapadnoj Evropi dolazi do zastoja u razvoju teorije vjerovatnoće. Međutim u Rusiji, mnogi veliki matematičari počinju ozbiljnije da se bave ovom disciplinom i to prvo Bunjakovski i Ostrogradski a pod njihovim uticajem i Čebišev (1821- 1894) koji je unio nove ideje u teoriju vjerovatnoće. Njegovi najznačajniji sljedbenici bili su A. Markov (1856-1922) i A. Ljapunov (1858-1918). Za ime Markova vezani su “ Lanci Markova“ to jest nizovi slučajnih promjenljivih povezanih tako da vjerovatnoća realizacije jednog eksperimenta uzima određenu vrijednost ako je poznat rezultat prethodnog eksperimenta. Posebni doprinos dao je Ljapunov. Definisao je teoremu koja je dobila naziv “centralna granična teorema“. Zapravo, posebni interes za vjerovatnoće i statistiku počeo je poslije drugog Svjetskog rata. Naučni interes usmjeren je u više pravaca. Jedni produbljuju klasične granične teoreme, drugi je posvećuju primjenama u različitim oblastima, treći razrađuju nove oblasti. Metodi simulacije (Monte Karlo metodi) koristeći se računarima koriste se u najrazličitijim oblastima. Zahvaljujući razvoju teorije vjerovatnoće nastale su i nove matematičke discipline: • Teorija masovnog opsluživanja • Teorija informacija • Teorija pouzdanosti tehničkih sistema • Teorija zaliha. Matematička statistika kao naučna disciplina počela je da se razvija tek nedavno. Dugo se sastojala od vjerovatnoće, približnih formula, empirijsih razmatranja, i intinuitivnih pravila. Savremena statistička metodologija vezana je za imena Amerikanaca Nejmana i Volda. Zahvaljujući njihovim radovima razvile su se tri oblasti: • Teorija estimacije (ocjene) • Teorija provjere (verifikacije) statističkih hipoteza • Teorija planiranja eksperimenta.

5

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

3. SREDNJE VRIJEDNOSTI 3.1. Pojam, značaj i vrste srednje vrijednosti Srednja vrijednost je reprezentativna vrijednost, koja po datim mjerilima zamenjuje sve vrijednosti obilježja u datoj seriji. U statističkoj literaturi dobila je naziv reprezentativna vrijednost zato što predstavlja i zamenjuje sve vrijednosti serije, jer iz njih proističe i njihove zajedničke karakteristike. Kao reprezentativni pokazatelj serije srednja vrijednosti karakteriše statistički skup. Ako se posmatra jedan statistički skup po jednom numeričkom obilježju i pođe se od individualnih vrijednosti tog obilježja, teško će se uočiti bitna i zajednička karakteristika čak i kad se pojedinačni podaci, grupisanjem u seriju, svedeni na manji broj. Zato se nastoji da se ta serija zamjeni jednim brojem koji omogućuje da se uoči karakteristika posmatranog skupa. Značaj srednje vrijednosti sastoji se u tome što kao informacija može da zamjeni niz vrijednosti serije; polazeći od posebnih i pojedinačnih odlika pojave, dovodi do opšte i zajedničke odlike kao pravilnosti pojave. Srednja vrijednost na uopšten i jednostavan način omogućuje da se iz promenljivih vrijednosti (varijabilnosti) pojava otkrije u njima ono što je bitno i tipično. Ona se upotrebljava kako za sažimanje podataka o skupu, tako i za karakterisanje njegove dinamike. To je vrijednost koja omogućava poređenje karakteristika raznih pojava. Srednja vrijednost, kao sintetički i reprezentativni pokazatelj nalazi primjenu u svim oblastima statističke analize. Da bi srednja vrijednost imala značaj reprezentativne i tipične vrijednosti, neophodno je da se određuje iz homogenog statističkog skupa. Pod homogenim skupom podrazumeva se skup istovrsnih jedinica posmatranja. U slučaju da je skup heterogen (sastavljen od različitih jedinica) potrebno je najprije izvršiti podjelu skupa u homogene dijelove, a zatim će se posebno odrediti srednje vrijednosti za svaki od tih dijelova. Računski i formalno moguće je naći srednju vrijednost i u heterogenom skupu, ali takva vrijednost nema značaj statističke srednje vrijednosti kao reprezentativnog pokazatelja. Uzmimo, kao primjer, određivanje prosječne plate u jednom preduzeću na osnovu plata direktora, proizvodnog kvalifikacionog radnika, psihologa i spremačice. Računski to je jednostavan postupak jer su sve plate u konvertibilnim markama, pa ih možemo sabrati i podjeliti sa 4. Međutim, šta znači prosjek i čiju platu dobijamo? Iz vrijednosti takvih heterogenih jedinica ne može se dobiti reprezentativna vrijednost u statističkom smislu. Sasvim je drugi slučaj ako izračunamo prosječnu platu svih kvalifikovanih radnika. Isto tako, i prilikom upoređivanja srednjih vrijednosti dva statistička skupa vodi se računa o homogenosti tih skupova. Znači pri određivanju i primjeni srednjih vrijednosti mora biti zadovoljen princip homogenosti statističkog skupa. Srednja vrijednost datog obijležja u statističkom skupu može se odrediti po raznim mjerilima: kao vrijednost koja se izračunava na osnovu svih vrijednosti posmatranog obilježja ili izabrati između konkretnih vrijednosti obilježja prema položaju koje zauzima u seriji. Prema tome da li se izračunavaju ili određuju prema položaju pojedinih vrijednosti obilježja, srednje vrijednosti se mogu podjeliti u dve grupe:

6

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

1. izračunate srednje vrijednosti, u koje spadaju aritmetička, geometrijska, harmonijska i druge, i 2. pozicione srednje vrijednosti, među kojima su najpoznatije modus i modijana. Svaka od spomenutih srednjih vrijednosti određuje se posebnim statističko matematičkim metodama i ima određene karakteristike. Srednje vrijednosti ne mogu se izračunati (odnosno odrediti) kod svih serija. One se izračunavaju, odnosno određuju samo kod numeričkih (rasporeda frekvencija), a mogu se izračunati i iz vremenskih serija. Za utvrđivanje karakteristika rasporeda frekvencija one predstavljaju polaznu osnovu. Srednja vrijednost jedne serije ne može biti manja od najmanje vrijednosti obilježja, niti veća od naveće vrijednosti obilježja. Srednja vrijednost može biti i neka vrijednost koja uopšte ne postoji u seriji (na primjer, u jednom preduzeću može biti prosečna plata 577 KM, a da niko u tom preduzeću nema takvu platu). Srednja vrijednost može imati i decimalan broj, iako se vrijednosti obilježja izražavaju samo cijelim brojem (na primjer, prosječan broj članova domaćinstva može biti 3,4).

3.2. ARITMETIČKA SREDINA Najširu upotrebu u statističkim istraživanjima, kao i svakodnevnom životu, stekla je aritmetička sredina, ili, kako se popularno naziva, prosjek. U praktičnom životu, često se govori o prosječnoj proizvodnji, prosječnoj zaradi, prosječnoj potrošnji mlijeka, prosječnoj težini, itd. Takve, i slične prosječne vrijednosti predstavljaju aritmetičku sredinu. Aritmetička sredina može se izračunati iz grupisanihi negrupisanih podataka. 3.2.1. Aritmetička sredina iz negrupisanih podataka. Kada su podaci negrupisani, tj. svaki podatak se javlja samo jedanput (sa frekvencijom 1), aritmetička sredina se izračunava tako što se zbir vrijednosti obilježja podjeli njihovim brojem. Ako se pojedine vrijednosti obilježja obilježe sa x1, x 2 , x3,... x n , njihov broj sa n (koji predstavlja broj jedinica posmatranja),a aritmetička sredina sa x , izračunavanje aritmetičke sredine iz negrupisanih podataka može se izraziti sljedećim obrascem:

x=

x1 + x 2 + x3 + ... + x n n

ili, ako se zbir označi sa Σ (sigma): x=

∑x . n

7

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Na primjer, u našem odjeljenju, odabrali smo uzorak od 5 učenika i posmatrali ih po broju opravdanih izostanaka: 24, 25, 27, 30, 34. Aritmetička sredina izračunaće se primjenom datog obrasca na sljedeći način. x=

∑x = 24 + 25 + 27 + 30 + 34 = 140 = 28 5

n

5

Aritmetička sredina u datom primjeru znači da je prosječan broj izostanaka po učeniku 28. Na grafikonu 1. nalazi se grafički prikaz rješenja za ovaj primjer. Средња в редност 40 35 Број изостанака

30 25 20

Средња вредност

15 10 5 0 1

2

3

4

5

6

Број ученика

Grafikon 1. Srednja vrijednost izostanaka.

3.2.2. Aritmetička sredina iz grupisanih podataka U statističkim istraživanjima često se pojavljuje veći broj podataka i njihovih različitih frekvencija, naime grupisani podatci u vidu rasporeda frekvencija. U takvim slučajevima vrijednosti obilježja se najprije množe odgovarajućim frekvencijama, zatim se tako dobijeni proizvodi saberu i taj zbir se, najzad podjeli zbirom frekvencija, odnosno ukupnim brojem svih jedinica posmatranja. Za izračunavanje aritmetičke sredine može se, prema tome napisati sljedeći obrazac: x=

x1 f1 + x 2 f 2 + ... + xi f i + ... + x n f n f1 + f 2 + ... + f i + ... + f n

Ili uprošteno: x=

∑xf ∑f

8

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Ova aritmetička sredina dobila je naziv ponderisana aritmetička sredina, prema samom postupku izračunavanja, koji se sastoji u ponderisanju vrijednosti datog obilježja. Množenje pojedinih vrijednosti obilježja odgovarajućim vrijednostima ( x1 ⋅ f1 ; x 2 ⋅ f 2 ; x3 ⋅ f 3 ) itd naziva se ponderisanje vrijednosti, što u stvari znači dodavanje odgovarajućeg značaja svakoj vrijednosti, naziva se ponder, u ovom slučaju to su frekvencije. Ukoliko neka vrijednost ima veću frekvenciju, utoliko joj je i značaj veći, jer jače utiče na veličinu aritmetičke sredine. Ponderisanjem vrijednosti obilježja obuhvataju se sve vrijednosti datog obilježja, jer množenje pojedinih vrijednosti njihovom frekvencijom predstavlja uzimanje te vrijednosti onoliko puta koliko se i javlja. Kod aritmetičke sredine za negrupisane podatke uzimaju se sve vrijednosti obilježja ali ponderisanja nema, zato što se svaka vrijednost jedan put javlja i prema tome sve vrijednosti su podjednako značajne ili važne. Za izračunavanje ponderisane aritemtičke sredine uzećemo kao primjer podatke o broju radnika –inovatora (zaposlenih u industrijskim preduzećima) i o broju njihovih pronalazaka kojima su doprinjeli savremenijoj i ekonomičnijoj proizvodnji. Podaci grupisani u vidu serije rasporeda frekvencija dati su u tabeli 1. Broj pronalazaka 3 5 8 10 12 Ukupno

Broj radnika 2 8 5 3 2 20

Tabela 1.-Raspored radnika inovatora prema broju pronalazaka

Na osnovu ovih podataka i datog obrasca za izračunavanje ponderisane aritemtičke sredine, postupak izračunavanja može se lakše i preglednije obaviti pomoću radne tabele kao što je tabela 2. Broj pronalazaka 3 5 8 10 10 Σ

Broj radnika inovatora (ƒ) 2 8 5 3 2 20

x⋅ f 6 40 40 30 24 140

Tabela 2.-Postupak izračunavanja ponderisane aritmetičke sredine.

∑ Uzmimo konačan obrazac: x =

xf

∑f

Iz obrasca se vidi postupak rada:  Pomnožiti vrijednost obilježja frekvencijama ( x ⋅ f ) pri čemu se vrijednosti ponderišu;  sabrati dobijene proizvode ∑xf , 9

Tahmiščija Faruk Saobraćajni fakultet



Statistika Vjerovatnoća i statistika

sabrati frekvencije

∑f i

 ∑xf podjeliti zbir proizvoda vrijednosti obilježja i frekvencija zbirom frekvencija   ∑f Izračunate veličine učvršćuju se u obrazac i dobija se ponderisana aritmetička sredina:



x=

∑xf ∑f

=

 .  

140 = 7. 20

Što znači da je prosječan broj pronalazaka po radniku - inovatoru 7. Aritmetička sredina, kao izračunata vrijednosti na osnovu svih vrijednosti obilježja, po svom apsolutnom iznosu može, ali ne mora, da se poklapa s jednom od vrijednosti u seriji. Međutim, ona je najčešće bliska vrijednostima obilježja čije su frekvencije najveće, jer su te vrijednosti najviše uticale na njen iznos. U datom primjeru najveći značaj imaju vrijednosti 5 i 8, čije su frekvencije najveće, pa je zbog toga i aritmetička sredina 7 bliska tim vrijednostima. Ovo svojstvo aritmetičke sredine omogućuje da se orijentaciono provjeri tačnosti izračunate aritmetičke sredine. Ako se aritmetička sredina približava nekoj od vrijednosti serije sa malom frekvencijom, potrebno je provjeriti ispravnost računarskog postupka, a to treba učiniti i ako je ona manja od najmanje vrijednosti ili veća od najveće vrijednosti obilježja u seriji. U statističkim istraživanjima često se operiše s kontinuiranim vrijednostima grupisanim u vidu integralnih serija. Zbog toga se javlja potreba da se pri izračunavanju aritmetičke sredine vodi računa o tome da su vrijednosti date u vidu grupnih integrala. Pravilo je dase za svaki interval odredi jedna vrijednost koja će predstavljati ili zamenjivati sve vrijednosti u okviru grupnih intervala. Obično se uzima sredina grupnog intervala koja se određuje kao prosjek gornje i donje granice svakog intervala. Kada je interval otvoren (na donjoj ili gornjoj granici), u našen primjeru u tabeli 3 na donjoj – do 20), uzima se za dužinu intervala dužina koju imaju ostali intervali (u našem primjeru 10). Zato smo kod određivanja sredine intervala uzeli za donju granicu prvog (otvorenog) intervala 10. Isto bi se postupilo da je otvorena gornja granica poslednjeg intervala. Intervalne sredine predstavljaju vrijednost obilježja ( x ) u datoj seriji i na osnovu njih i odgovarajućih frekvencija izračunava se aritmetička sredina za grupisane podatke. Uzmimo, kao primjer, da na osnovu podataka iz tabela 3 i 4 izračunamo ponderisanu aritmetičku sredinu vrijednosti koje su relativni brojevi i koje su grupisane u vidu intervalne serije rasporeda frekvencija. %dobiti do 20 20-30 30-40 40-50 50-60 60-70 Ukupno

Broj restorana 9 12 12 9 6 2 50

Tabela 3.- Raspored nekoliko privatnih restorana prema % dobiti

10

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Uzmimo, kao primjer, da na osnovu podataka iz tabele 4. izračunamo ponderisanu aritmetičku sredinu vrijednosti koje su relativni brojevi i koje su grupisane u vidu intervalne serije rasporeda frekvencija. Sredina intervala (x)

10 + 20 = 15 2 20 + 30 = 25 2 30 + 40 = 35 2 40 + 50 45 2 50 + 60 = 55 2 60 + 70 = 65 2 Ukupno Σ

ƒ

x⋅ f

9

135

12

300

12

420

9

405

6

330

2

130

50

1720

Tabela 4.- Radna tabela za obračun ponderisane aritmetičke sredine iz intervalne serije

Na osnovu podataka iz radne tabele (4) aritmetička sredina će iznositi: x=

∑xf ∑f

=

1720 = 34,4 . 50

Dobijeni rezultat pokazuje da je 34.4% prosječan procenat dobiti u poslavanju privatnih restorana u Beogradu.

3.3. OSOBINE ARITMETIČKE SREDINE Upotreba aritmetičke sredine rasprostranjena je u svim oblastima statističke analize. Za praktičnu primenu aritmetičke sredine i teorijska istraživanja važno je poznavati najvažnije osobine koje ia aritmetička sredina: 1. svi podaci serije ulaze u obzir za izračunavanje aritmetičke sredine, tako da sve vrijednosti pbeležja utiču na veličinu aritmetičke sredine zavisno od veličine i frekvenicje; 2. aritmetička sredina se uvek nalazi između najmanje i najveće vrijednosti obilježja, što se matematički može predstaviti izrazom: X MIN < X < X MAX

3. kada se zameni svaka vrijednost u seriji aritmetičkom sredinom, zbir mora ostati isti. U našem primjeru zbir izostanaka svih 5 učenika iznosi 24+25+27+30+34=140. Ako bi 11

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

svaki učenik imao isti broj izostanaka (28) ukupan broj izostanaka bio bi 28+28+28+28+28=140; 4. Zbir pozitivnih odstupanja od aritmetičke sredine jednak je zbiru negativnih odstupanja, tako da je algebarski zbir svih odstupanja ravan nuli. Za razumevanje ove osobine potrebno je nešto znati o odstupanjima od aritmetičke sredine. Odstupanja se računaju ako se od svake pojedine vrijednosti obilježja oduzima aritmetička sredina ( x,−x ) Na osnovu oznake za zbir Σ i izraza za odstupanje, može se matematičkim izrazom prikazati da je suma odstupanja svih vrijednosti obilježja od aritmetičke sredine jednak nuli:

∑( X − X ) = 0; 5. Zbir kvadrata odstupanja pojedinih vrijednosti obilježja od aritmetičke sredine daje najmanju moguću sumu. To znači da zbir kvadriranih odstupanja pojedinih vrijednosti obilježja od neke druge vrijednosti razćičite od aritmetičke sredine daje veću sumu:

∑( X − X )

2

= min .

3.4. GEOMETRIJSKA SREDINA Geometrijska sredina je takođe, izračunata srednja vrijednost, ali se razlikuje od aritmetičke sredine i po svojim karakteristikama i po načinu izračunavanja. Geometrijska sredina dobija se kada se iz proizvoda pojedinih vrijednosti obilježja date serije izvadi koren čiji je izložilac ravan broju članova čitave serije. Ako se pojedine vrijednosti obilježja označe sa x1, x 2 , x3,... x n , a njihov broj sa n , obrazac za izračunavanje geometrijske sredine biće:

Pošto se ovde javljaju koreni sa većim izložiocima. za izračunavanje geometrijske sredine moraju se koristiti i logaritmi, tj. logaritmovaće se najpre leva i desna strana obrasca:

LogG =

log x1 + log x2 + ... + log xi + ... + log x n . n

Koristeći Σ kao znak za zbir, obrazac za izračunavanje geometrijske sredine može se napisati u obliku: 12

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

LogG =

∑log x . n

Na ovaj način dobija se logaritam geometrijske sredine. Pošto nama treba geometrijska sredina, a ne njen logaritam, moramo izvršiti antilogaritmovanje, pa će uprošćen obrazac za izračunavanje geometrijske sredine biti:

G =N

∑log x . n

Njena upotreba u statističkim istraživanjima je znatno manja. Geometrijska sredina se najčešće primenjuje za istraživanje, tj. izračunavanje srednjeg tempa razvoja koji se dobija kao geometrijska sredina lančanih indeksa vremenske serije. Tempo razvoja je relativna vrijednost koja se dobija kad se uzastopni članovi vremenske serije stave u odnos, tj. podele prethodnim članovima. Oni se mogu izraziti i u procentima, ako se pomnože sa 100. To su lančani indeksi. Primenimo sada geometrijsku sredinu za izračunavanje srednjeg tempa razvoja proizvodnje hleba i peciva u našoj zemlji od 2001. do 2006. godine (datih podataka u tabeli 5). Da bismo izračunali srednji tempo razvoja proizvodnje hleba i peciva za dati period potrebno je da izračunamo geometrijsku sredinu lančanih indeksa. To znači da najpre moramo naći lančane indekse, a zatim odgovarajuće logaritme za lančane indekse ove serije, koje unosimo u četvrtu kolonu tabele 5.

2001

Proizvodnja u hiljadama tona 320

2002

324

2003

387

2004

364

2005

366

2006

340

Godina

Izračunavanje lančanih indeksa (x) ...

324 *100 = 101 320 387 *100 = 119 324 364 *100 = 94 387 366 *100 = 101 364 340 *100 = 93 366

log x

2,00432 2,07554 1,97314 2,00432 1,96848

Tabela 5. Tempo razvoja proizvodnje hleba i peciva u Srbiji 2001-2006. godine.

Zbir logaritama iznosi 10,02580. Kada ga podjelimo sa 5, koliko iznosi broj članova serije (lančanih indeksa) i nađemo antilogaritam, dobijamo traženu geometrijsku sredinu. Konkretno to znači: 13

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

G =N

∑log x n

=

N

10,02580 N = 2,005160 = 101,2 5

Srednji tempo razvoja, prema tome, iznosi 101,2 odnosno proizvodnja hleba i peciva u datom periodu povećala se iz godine u godinu u prosjeku za 1,2% ( G-100=101.2-100=1,2).

3.5. HARMONIJSKA SREDINA Upotreba harmonijske sredine (H) još se ograničenije od upotrebe geometrijske sredine. Ona se koristi samo u specijalnim slučajevima gde se problem može postaviti i u obrnutom, recipročnom vidu. Produktivnost rada na primjer, može se meriti (izraziti) na dva načina: kao broj proizvedenih proizvoda u jedinici vremena ili, recipročno, kao vreme potrebno za proizvodnju jedinice proizvoda. Isto se tako može posmatrati obrt kapitala u jedinici vremena i, recipročno, potrebno vreme da bi se izvršio obrt jedinice kapitala itd. Najčešće se koristi za izračunavanje: srednjeg vremena izrade jedinice proizvoda, srednjih cena, kupovne snage novca i srednjeg vremena pređene jedinice puta, itd... Zavisno od toga da li su podaci negrupisani ili grupisani, može se izračunati prosta harmonijska sredina za negrupisane podatke ili ponderisana za grupisane podatke.

3.5.1. Harmonijska sredina za negrupisane podatke Prosta harmonijska sredina je recipročna vrijednost proste aritemtičke sredine određene iz recipročnih vrijednosti obilježja. Ako se sa x1, x 2 , x3,... x n označe vrijednosti obilježja, a sa n njihov broj, obrazac za izračunavanje harmonijske sredine biće:

H=

1

=

1 1 1 1 + + ... + ... x1 x 2 xi xn

1 1 1 1 1 + + ... + ... x1 x 2 xi xn

ili: H =

n 1 ∑x

.

Radi ilustracije postupka, izračunavanja proste harmonijske sredine, uzećemo podatke iz tabele 6. koja sadrzi sedmočasovni učinak pet radnika. 14

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Radnik

Proizvodnja kom. za 1.čas

A B C D E Komada Aritmetička sredina

6 10 12 15 30 73 75/5=14,6

Vreme izrade po kom. u minutima (x) 10 (60/6) 6 (60/10) 5 (60/12) 4 (60/15) 2 (60/30) 27 27/5=5,4

Tabela 6. – Sedmočasovni učinak pet radnika

Prosečna produktivnost ovih pet radnka, izražena brojem proizvedenih komada u jednici vremena, može se ispravno prikazati prostom aritmetičkom srednim koja iznosi 14,6 komada za 1 čas. Međutim, ako se prosečna produktivnost iste ove grupe izrazi u utrošenim vremenima za jedinicu proizvoda, pomoću proste aritmetičke sredine u iznosu 5,4 neće s dobiti odgovarajući rezultat, jer to nije recipročna vrijednost prosečne produktivnosti izražene brojem proizvedenih komada za 1 minut. Da proverimo: 60/14,6= 4,10958 a ne 5,4.

Izračunajmo harmonijsku sredinu:

H=

5 5 300 = = = 4,10958 1 1 1 1 1 6 + 10 + 12 + 15 + 30 73 + + + + 10 6 5 4 2 60

Dobije na je odgovarajuća recipročna vrijednost. Prema tome, prosečna produktivnost ove grupe radnike iznosi 14,6 proizvedenih komada za 1 čas ili, recipročno, potrebno je 4,10958 minuta za izradu jednog komada.

3.5.2. Harmonijska sredina za grupisane podatke Kada se radi o grupisanim podacima, izračunava se ponderisana harmonijska sredina. Ona će tada biti recipročna vrijednost aritmetičke sredine recipročnih vrijednosti obilježja pomnoženih (ponderisanih) odgovrajućim frekvencijama. Prema tome, obrazac za izračunavanje ponderisane harmonijske sredine glasi:

15

Tahmiščija Faruk Saobraćajni fakultet

H=

Statistika Vjerovatnoća i statistika

1 1 1 1 1 ⋅ f1 + ⋅ f 2 + ... + ⋅ f i + ... + ⋅ fn x1 x2 xi xn f 1 + f 2 + ... + f i + ... + f n

=

f 1 + f 2 + ... + f i + ... + f n 1 1 1 1 + + ... + + ... + x1 f 1 x 2 ⋅ f 2 xi ⋅ f i xn ⋅ f n

ili H =

∑f f ∑x

.

Ako bi u primjeru iz tabele 6 bilo: 5 radnika kojima za izradu jedinice proizvoda treba 10 minuta, 20 radnika kojima za izradu jedinice proizvoda treba 6 minuta, 10 radnika kojima za izradu jedinice proizvoda treba 5minuta 10 radnika kojima za izradu jedinice proizvoda treba 4 minuta, 5 radnika kojima za izradu jedinice proizvoda treba 2 minuta. prosečno vreme potrebno za izradu jedinice proizvoda izračunavaćemo pomoću ponderisane harmonijske sredine ovako: H=

50 50 3000 = = = 4,61538 5 20 10 5 10 30 + 200 + 120 + 150 + 150 650 + + + + 10 6 5 2 4 60

Harmonijska sredina kao i geometrijska sredina ne mogu se izračunati ako su neke vrijednosti jednake nuli.

3.6. MEDIJANA Medijana (Me) je vrijednost obilježja koja se nalazi u sredini serije čiji su svi članovi raspoređeni po veličini vrijednosti obilježja. Na taj način ona deli jedinice statičkog skupa na dva jednaka dela, tako da se i iznad nje i ispod nje nalazi po 50% svih jedinica. Medijana, kao i modus, nije izračunata srednja vrijednost, već vrijednost obilježja određena po položaju koji zauzima u nizu podataka. Praktično ona zavisi od broja članova u jednoj seriji, a ne od njihove veličine. Na iznos ove srednje vrijednosti ne utiču ekstremne vrijednosti obilježja, pa je zbog toga podesna kao vrijednost, kod serija s otvorenim intervalima . Uopšte, u slučajevima gde vrijednost članova u seriji znatnije variraju, medijana je bolja srednja vrijednost od aritmetičke sredine. 3.6.1. Medijana za negrupisane podatke Za neparne nizove negrupisanih podataka medijana se određuje jednostavno-traženjem središnjeg člana uređenog niza po veličini podatka. 16

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Tako će za niz podataka o broju ležajeva u 5 turističkih objekata koji, uređeni po veličini, iznose: 98, 102, 106, 112, 118, medijana biti 106. U ovoj seriji medijana je vrijednost trećeg člana, jer on zazuzima središnji položaj, dok su dva člana(50% serije) ispred i dva člana (50%) iza vrijednosti medijane. Za seriju negrupisanih podataka medijana se određuje na taj način što se ukupan broj članova serije, sređenih po veličini , poveća za jedan

( n +1) i podjeli sa 2, tj.

n +1 2

Vrijednost podatka koja se nalazi na tom mestu je medijana. Kod serija s neparnim brojem podataka to je, kao što smo videli, vrijednost centralnog podatka. Međutim, ako je broj podataka paran, u sredini se nalaze dve vrijednosti obilježja. U tom slučaju se kao medijana uzima njihova aritmetička sredina. Ako u ovom primjeru imamo podatak o broju ležaja i za šesti turistički objekat koji iznosi 120, serija će biti parna: 98,102,106,118,120. odredićemo medijanu: n +1 6 +1 7 = = = 3,5 2 2 2

tj. Ona je na sredini između trećeg i četvrtog člana serije, pošto se oba broja nalaze u središtu serije, a to znači:

Me =

106 + 112 218 = = 109 2 2

3.6.2. Medijana neintervalnih serija distribucije frekvencija U dosadašnjim primjerima medijanu smo vrlo jednostavno odredili, jer su bili u pitanju negrupisani podaci i vrlo mali broj podataka. U praksi se, međutim, susreću često serije sa velikim brojem podataka, pa se postavlja pitanje kako kod takvih serija odrediti medijanu za neintervalne i intervalne serije. Uzimamo najpre, turističke objekte prema broju noćenjaturista, prikazane u tabeli 7. Serija je neintervalna i neparna. Broj noćenja 1 700

Broj turističkih objekata 5

Kumulacija "ispod" 5

1 800

12

17

2 000

15

32

2 100

35

67

17

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika 2 500

20

87

2 800

10

97

3 000 Ukupno

2 99

99 -

Tabela 7.-Raspored turističkih objekata prema broju noćenja turista

Mediajna se i ovde određuje na principijelno isti način kao i kod serije s negrupisanim podacima, tj. ona je centralni čin serije: n +1 99 +1 100 = = = 50 2 2 2

Znači, medijana je vrijednost pedesetog člana serije. Da bi smo utvrdili koja je to vrijednost, kumuliraćemo frekvencije "ispod" i uneti kumulativne frekvencije u poslednju kolonu tabele. Idući kolonom kumulacije "ispod", vidimo da se pedeseti objekat nalazi u četvrtom redu i da je, prema tome, njegova vrijednost 2 100 noćenja. Za medijanu neintervalne serije s parnim brojem podataka uzećemo kao primjer tabelu 8. Broj rekreativnih turističkih centara

Broj opština

Komulacija "ispod"

0

1

1

1

10

11

2

12

23

3

11

34

4

4

38

5

6

44

Ukupno

44

-

Tabela 8- Raspored opština prema broju rekreativnih turističkih centara u Vojvodini 1997. godine

18

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Medijana kod serije sa parnim brojem podataka jednaka je aritmetičkoj sredini dva središna podatka. Formulom bi se to moglo izraziti ovako: n +1 44 +1 45 = = = 22,5 2 2 2

Znači medijana se nalazi između 22. i 23. člana serije. U poslednjoj koloni tabele 8. kumulacije "ispod", koju smo ovde izveli, pokazuje da se taj član nalazi u trećem redu, medijana je vrijednost obilježja 2. to znači da je 50% opštine u Vojvodini imalo 2 ili više od dva rekreativna turistička centra. Ako se središni članovi serije nalaze između dva broja kumulativne serije, medijana će biti aritmetička sredina dva odgovarajuća podatka. Predpostavimo da teba da odredimo medijanu 23. i 24. člana. U tom slučaju 23. članu bi odgovarao podatak 2, a 24. članu podatak 3, i tako bi vrijednost medijanu bila: Me =

2 +3 = 2,5 2

3.6.3. Medijana intervalne serije distribucije frekvencija Medijana se određuje na taj način što se najpre pomoću kumulacije frekvencija nađe interval u kome se nalazi medijana, a zatim se određuje pomoću sledećeg obrasca: n   2 − cumf1  Me = l +  ⋅i fm    

gde su: l-donja granica intervala u kome se nalazi medijana, fm- frekvencija tog intervala, i-dužina grupnog intevala, n-ukupan broj članova serije i cum f1 –kumulirana frekvencija intervalne grupe koja prethodi intervalu u kome se nalazi medijana. Da bismo navedeni obrazac primenili na podatke iz tabele 9 odredićemo najpre interval u kome se nalazi medijana. Kako serija ima paran broj podataka(44), to će središni članovi, prema ranije izloženoj formuli, biti: 44 +1 45 = = 22,5 odnosno 22. i 23. član 2 2

19

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Ovi članovi se nalaze u zbirnoj frekvenciji 27, a medijana, prema tome, u intervalu 350,1400,0. donja granica tog intervala (l) je 350,1; njegova frekvencija (fm) je 21; dužina intervala (i) je 50; kumulirana frekvencija (cum f1) intervala koji predhodi (300-350,0) je 6, a zbir svih članova (n) iznosi 44. Zamenom u datoj formuli dobija se:  44  50 − 6 Me = 2  = 350 + 800 = 388,09 350 +  21 21

Medijana je, dakle, 388,09, što znači da je polovina posmatranih sudskih sporova imala tu ili veću vrijednost. U tabeli 9. prikazane su vrijednosti ѕa određivanje intervalne serije distribucije frekvencije. Vrijednost sudskih rešenih sporova utaje poreza građana u dinarima

Broj sporova utaje poreza

Kumulacija "ispod"

do 300,0

1

1

300-350,0

5

6

350-400,0

21

27

400-450,0

14

41

450 i više

3

44

Ukupno

44

-

Tabela 9.- Radna tabela za određivanje medijane

3.7. MODUS Od pozicionih srednjih vrijednosti najčešće se primenjuje modus. To je vrijednost obilježja koje ima najveću frekvenciju. Prema tome, ne izračunava se iz svih vrijednosti jedne serije, već se uzima kao vrijednost obilježja koja se u statističkom skupu najčešće javlja. Pošto vrijednost modusa ima najveći broj jedinica datog skupa, smatra se da je modus tipična vrijednost koja može da okarakteriše čitavu seriju. Za seriju sa prekidnim vrijednostima obilježja se modus se određuje jednostavno: vrijednost obilježja čija je frekvencija najveća predstavlja modus. Odredićemo modus za podatke prodaje muških košulja po veličini, u toku januara 1995. godine, u jednoj robnoj kući u Beogradu. (tabela 10.). Veličine košulje

Broj prodatih košulja

37

50

38

59

39

94

40

108

41

85

42

50

20

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika 43

5

Ukupno

451

Tabela 10.-Raspored prodatih košulja po veličini u jednoj robnoj kući u januaru 1995.

godine

Vidimo da veličina (broj košulje) 40 ima najveću frekvenciju; prema tome, modus je 40. Modus se obično obeležava sa Mo, pa ćemo napisati Mo=40. To znači da je najviše prodato muških košulja veličine broj 40, odnosno da se ta veličina košulje najčešće kupuje. Za seriju čiji su podaci grupisani u vidu grupnih intervala određivanje modusa je složenije i postoje dve mogućnosti: -da se odredi približan modus, kao sredina grupnog intervala s najvećom frekvencijom ili -preciznije, pomoću određenog obrasca. Za preciznije određivanje modusa kod intervalnih serija grupisanih podataka polazi se od činjenice da se modus nalazi u intervalnoj grupi s najvećom frekvencijom, i to između donje i gornje granice tog intervala, pa se može odrediti pomoću obrasca: Mo = l +

f2 ⋅i f1 + f 2

gde je: l- donja granica modalnog intervala(intervala s najvećom frekvencijom u kome se nalazi modus), f1-frekvencija intervala koji se nalazi ispred modalnog intervala, f2- frekvencija intervala iza modalnog intervala, a i- dužina grupnog intervala. Za distribuciju frekvencije prikazano u tabeli 11 odredićemo modus polazeći od modalnog intervala. Starost u godinama

Broj delegata

25-29

10

30-34

17

35-39

9

40-44

8

Ukupno(Σ)

44

Tabela 11.-Starost delegata u jednoj osnovnoj zajednici za zapošljavanje u Srbiji 1994.godine

Modalni interval je 30-34 zato što taj interval ima najveću frekvenciju. Možemo reći, približno, da je modus sredina tog intervala, tj. 32,5 (Mo=32,5). Tačnije ćemo odrediti njegov iznos primenom obrasca: 21

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

Mo = l +

f2 ⋅i f1 + f 2

Pošto je j = 30, f1 = 10, f 2 = 9, i = 5 l=30; imaćemo da je: Mo = 30 +

9 45 ⋅ 5 = 30 + = 30,0 + 2,4 , 10 + 9 19

Mo = 32.4

Ovako dobijeni modus, u iznosu od 32,3 godine, pokazuje da je najveći broj delegata u ovoj osnovnoj interesnoj zajednici za zapošljavanje toliko star. Pri korišćenju modusa treba imati u vidu da na njegovu veličinu utiče način grupisanja podataka. Kako se formiranje grupnih intervala može izvesti na razne načine, to se s promenom veličine grupnih intervala, ili grupnih granica pri istim intervalima, mogu dobiti različite vrijednosti modusa. Modus je pogodan pokazatelj za one serije kod kojih samo jedna vrijednost obilježja ima najveću frekvenciju, i to naročito ako je frekvencija modalne vrijednosti velika. Takve serije nazivaju se unimodalnim (s jednim modusom) i u tim slučajevima modus je karakteristična vrijednost. Postoji mogućnost da u jednoj seriji ima više modusa ili da se modus ne može odrediti. Evo i takvih primjera. U odeljenju trećeg razreda ekonomsko-komercijalne struke na osnovu ocena iz statistike i matematike sastavili smo dve serije i prikazali jednu u vidu tabele 12, a drugu u vidu tabele 13.

Ocene

Broj učenika

1

2

2

9

3

9

4

3

5

2

Ukupno

25

Tabela 12.- Raspored učenika po ocenama iz statistike

U odeljenju trećeg razreda ekonomsko-komercijalne struke na osnovu ocena iz statistike i matematike sastavili smo dve serije i prikazali jednu u vidu tabele 13. Ocene

Broj učenika

1

5

2

5

3

5

22

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika 4

5

5

5

Ukupno

25

Tabela 13.- Raspored učenika po ocenama iz matematike

U rasporedu učenika po ocenama iz statistike imamo dva modusa: ocene 2 i 3, jer obe imaju istu najveću frekvenciju. U rasporedu učenika po ocenama iz matematike nema modusa. Sve ocene imaju jednaku frekvenciju, nijedna ocena nije najčešća. Prema tome, modus se ne može odrediti u serijama čije sve vrijednosti imaju jednake frekvencije. Iako se modus ređe primenjuje od aritmetičke sredine, za neka statistička istraživanja je pogodniji, jer daje potpunu informaciju o tendenciji okupljanja vrijednosti obilježja oko srednje vrijednosti. Tako se, na primjer, upotrebljava za utvrđivanje najčešće cene na tržištu, za sagledavanje traženja pojedinih brojeva obuće ili odeće i slično, kada je prikladnije konkretno obaveštenje nego prosječan broj, koji može biti i decimalan, pa samim tim nedovoljno informativan. Kada govorimo o srednjim vrijednostima, bilo izračunatim, bilo pozicionim, moramo imati u vidu da svaka od njih u praksi ima svoje mesto, kako sa stanovišta izračunavanja. Koju srednju vrijednost odabrati kao najpodesniju karakteristiku distribucije frekvencija zavisiće, u krajnjoj liniji, od cilja istraživanja.

4. ZAKLJUČAK Cilj ovog seminarskog rada bio je da objasni teorijski srednje vrijednosti, njihovu primenu kako teorijski, tako i na praktičnim prmierima. Osvrnuli smo se prvo na podelu srednjih vrijednosti, zatim na detaljno objašnjenje svake od njih, kao i njihovu primenu u svakodnenom životu. Jer nema boljeg objasnjenja teorije nego kad pokažemo gde je ona primenljiva u društvu, i čini mi se da smo sa te strane kolega i ja uspeli. Nadam se da je ovaj seminarski rad pomogao Vama, posmatračima i čitaocima da vam pojasni temu, ukoliko ste već imali prilike da se sretnete sa temom, a onima koji do sada nisu imali susreta sa ovom tematikom da razumete i nadam se da će vam pomogne u životu, kako na teorijskom nivou, tako i praktičnom.

23

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

5.INDEKS POJMOVA V varijabilna –promenljiva

3

H homogeni skup podrazumeva se skup istovrsnih jedinica posmatranja

3

M Medijana (Me) - je vrijednost obilježja koja se nalazi u sredini serije čiji su svi članovi raspoređeni po veličini vrijednosti obilježja

14

modus - to je vrijednost obilježja koje ima najveću frekvenciju

P ponder - množenje pojedinih vrijednosti obilježja odgovarajućim vrijednostima prosjek - srednja vrijednost 24

18

6 4

Tahmiščija Faruk Saobraćajni fakultet

Statistika Vjerovatnoća i statistika

R reprezentativna - predstavljati, zamenjivati

3

6. LITERATURA 1. Mileva Žižić, Marija Vidić, 3.izdanje, “ Statistika za IV razred ekonomske, ugostiteljeskoturističke i pravno birotehničke škole“, 2003.godine 2. Prem S. Mann, 6.izdanje, “Uvod u statistiku“, Ekonomski fakultet u Beogradu, 2009.godine 3. Milutin Stojković, "Primena statistike u menadžmentu kroz primjere", 2. izdanje, Univerzitet u Novom Sadu, Ekonomski fakultet u Subotici, Subotica, 1998. 3. http://hr.wikipedia.org/wiki/Geometrijska_sredina 4.http://www.diplomski-rad.com/STATISTIKA/seminarski-diplomski-rad-statistika-srednjevrijednosti.html 5.http://www.mef.hr/if/alati/racunala/skripte/m_c_te.htm 6.http://wapedia.mobi/bs/Geometrijska_sredina 7.http://www.vguk.hr/novostic/91/206-100.pdf 8. http://sr.wikipedia.org/sr/Aritmeti%C4%8Dka_sredina 9. http://www.ebooks.com/

25

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF