Sampling With Probability Proportional to Size (Pps

January 26, 2019 | Author: Irdiena Izza Ell Milla | Category: N/A
Share Embed Donate


Short Description

Download Sampling With Probability Proportional to Size (Pps...

Description

SAMPLING WITH PROBABILITY PROPORTIONAL TO SIZE (PPS SAMPLING) Contact: [email protected]

A. Defini inisi

PPS Sampli Sampling ng adalah adalah suatu suatu metode metode pengam pengambil bilan an sampel sampel dari sebuah sebuah  populasi dimana peluang terpilihnya setiap unit sampel sebanding dengan ukuran. Ukuran tersebut adalah informasi tambahan yang dimiliki dimiliki oleh setiap setiap unit sampel yang yang dijadi dijadikan kan sebagai sebagai dasar dasar pertim pertimban bangan gan dalam dalam penarik penarikan an sampel sampel sehingga sehingga dapat diperoleh estimator-estimator yang lebih efisien. Info Inform rmasi asi tamb tambah ahan an (ukur (ukuran) an) yang yang bergu berguna na untuk untuk dija dijadi dika kann dasar  dasar   pertimbangan penarikan sampel adalah inform,asi yang mempunyai korelasi yang kuat dengan variabel-variabel yang akan diteliti. B. Keunt euntun unga gan n

Keuntungan yang dapat diperoleh dari PPS Sampling, yaitu: Akan diperoleh estimator yang unbiased terhadap populasi. Dapa Dapatt member memberik ikan an esti estima mato tor-a r-ast stim imat ator or yang yang lebih lebih sede sederha rhana na..

1.

2. 3.

Mempuny Mempunyai ai akura akurasi si yang yang lebih lebih ting tinggi gi diba dibandi ndingk ngkan an meto metode-m de-meto etode de lain lain.. A. Kerug erugia ian n

1.

Pemi Pemili liha hann

samp sampel el deng dengan an me meng nggu guna naka kann pros prosed edur  ur  With Out    Replacement (WOR) lebih sulit dilakukan.

A. Kondi Kondisi si Pengg Pengguna unaan an

PPS PPS Samp Sampli ling ng digu digunak nakan an pada pada saat saat setia setiapp unit unit sampe sampell dalam dalam popul populasi asi memiliki ukuran yang bervariasi sehingga peluang terpilihnya sampel tidak sama. Semaki Semakinn besar besar ukuran ukuran suatu suatu unit unit sampel sampel,, maka maka semakin semakin besar pula pula peluang peluang terpilihnya unit sampel tersebut. Selain itu, penggunaan PPS Sampling harus

memperhatikan ada tidakanya hubungan yang kuat antara informasi tambahan (ukuran) yang dimiliki oleh setiap unit sampel dengan variabel-variabel yang ingin diteliti. B. Kasus Kasus Pengg Penggun unaa aan n

Variabel yang Diteliti

Informasi Tambahan (Ukuran)

Rata-rata pengeluaran pulsa per   bulan

Jumlah handphone yang dimiliki

Jumlah produksi sebuah pabrik

Jumlah pekerja yang dimiliki

Rata-rata indeks prestasi mahasiswa

Lamanya jam belajar 

C. Pemilihan Pemilihan Sampel Sampel Dari Suatu Daftar (LIST) 1. Metode Kumulat latif 

• membuat frekuensi kumulatif dari ukuran yang dijadikan dasar    penari penarikan kan sampel sampel untuk untuk seluruh seluruh unit unit dalam dalam popula populasi si (jumla (jumlahh kumulatif dari ukuran auxiliary information) untuk seluruh unit dalam populasi. • Mengambil suatu angka random dari 1 sampai Z • Bila i-1ziiNyipiyjpjKovtitj

=1n2ni=1Nyipi2pi1- pi+2i=1Nj>iNyipiyjpj∙0 =1n2 ni=1Nyipi2pi1- pi VYPPS=1ni=1Nyipi2pi-yipi2p12 =1ni=1Nyi2pi-yi2 VYPPS=1ni=1Nyi2pi-Y2 =1ni=1Npiyi2pi-Y2

dengan i=1Npi=1. Jadi, VYPPS tidak bias.

Penduga yang tidak bias bagi VYPPS adalah vYPPS=1n(n-1)i=1nyixi-YPPS2

Bukti: i=1nyixi-YPPS2=i=1nyixi-Y2-nYPPS-Y2

selanjutnya nn-1vYPPS=i=1nyixi-YPPS2 Enn-1vYPPS=Ei=1nyixi-Y2-nYPPS-Y2 nn-1EvYPPS=Ei=1Ntiyizi-Y2-n VYPPS nn-1EvYPPS =ni=1npiyipi-Y2-n VYPPS =n∙n VYPPS-n VYPPS =n2VYPPS-n VYPPS =nn-1VYPPS

EvYPPS=VYPPS

dila  YPPS=1n i=1nyipi pi=xiX X=i=1Nxi

Merupa Merupakan kan perki perkira raan an yang yang tidak tidak bias bias terhad terhadap ap Y dengan dengan varians V (YPPS)=1n i=1npi yipi- Y2

Bukti : Misalkan ti= jumlah waktu ; i= 0, 1, 2, ..., n Sehingga distribusi frekuensi gabungan dari ti untuk N unit dan populasinya adalah pada saat n dimasukkan ke dalam kotak ke-i ke -i adal adalah ah pi pada pada seti setiap ap pema pemasuk sukan an,, sehi sehing ngga ga dist distri ribu busi si gabungan ti adalah rumus multinomial n!t1!t2!… tN! p1t1p2t2… pNtN

Sehingga diketahui E(ti) = n pi V(ti) = n pi (1-pi) Cov(t1,t2) = -n pi pj Sehing Sehingga ga : jika jika sebuah sebuah sampel sampel beruku berukuran ran n unit unit diambi diambill dengan probabilita pi, dengan pengembalian maka  YPPS=1n i=1nyipi   YPPS=1n t1y1p1+t2y2p2+…+tNyNpN=1n i=1Nti yipi

t adalah variabel acak, yi dan pi adalah sekumpulan bilangan tetap

E(ti) = n pi E( YPPS  YPPS)= 1n i=1nnpi yipi=i=1nyi=Y Sehingga YPPS tidak bias V YPPS= YPPS= 1n2 i=1nVyip i=1nVyipi=1n i=1n2i= 2i=1nj= 1nj=1NYj 1NYjPj-Y2 Pj-Y2Pj=1 Pj=1n n i=1N i=1N YiPiYiPi Y2Pi= 1n i=1N Yi2Pi2- Y2

Nilai Covarians Covyipi , yjpj , jika j ≠ i, akan menjadi 0. Ini menunj menunjukk ukkan an bahwa bahwa varian varians s estim estimato atorr adala adalah h propor proporti ti yang yang berkebalikan dengan ukuran sampel (n) pada SRS WR Jika Jika sebu sebuah ah samp sampel el beru beruku kura ran n n unit unit diam diambi bill deng dengan an probabili probabilita ta proporsio proporsional nal terhadap terhadap ukuran, ukuran, degan degan pengembal pengembalian ian (WR) : pi=xiX dan dengan pengembalian  YPPS=1n i=1nyipi  YPPS=Xn i=1nyixi= Xn i=1nyi=Xy

adalah rata-rat rata-rata a tak tertimba tertimbang ng dari rata-rat rata-rata a unitnya unitnya y adalah adalah perkiraan yang tak bias dari Y dengan varians V(YPPS)=Xn i=1nxi( yi-Y)2 yi= yixi  Y=YX  Y=YPPSX=NnXi=1nyi  YR= YRX=i=1nyii=1nxi = rata-rata sampel per elemen

Sehingga, unbiased estimator dari rata-rata populasinya :  YPPS=yN=1n Ni=1nyipi= Xn Ni=1nyixi

Unbiased Unbiased estimator estimator V(YPPS) pada pada PPS PPS Samp Sampli ling ng WR nya nya adalah :

v YPPS= i=1nYi-Y2nn-1=1nn-1i=1nyipi-Y2= 1nn1i=1nyipi2+i=1nYPPS2-2 YPPS n YPPS u=1nn-1i=1nyipi2+ n YPPS2-2 n  YPPS2= 1nn-1i=1nyipi2+ n YPPS2

Dan Unbiased estimator V(YPPS) pada PPS Sampling WR nya adalah : v YPPS= 1nn-1i=1nyiN pi-YPPS2 = 1nn-1i=1nyiNpi2+ i=1nYPPS22 YPPS YPPS i=1ny i=1nyiNp iNpii =1nn=1nn-11N 11N2i= 2i=1ny 1nyip ipi2+ i2+ n YPPS2YPPS2-2 2 n YPPS2= YPPS2= 1nn1nn11N2i=1n 11N2i=1nyipi yipi2+ 2+ n YPPS2 YPPS2 = 1nn-11N2 1nn-11N2i=1n i=1nyipi yipi2+ 2+ n YPPS2N2 YPPS2N2 =1nn=1nn1N2i=1nyipi2+ n YPPS2 a. Koefisi Koefisien en relat relative ive / relativ relativee effici efficiency ency

Perbandingan sampling PPS WR dan SRS WR dengan sampel yang sama dapat diketahui. Seperti yang diketahui sebelumnya, varians dari SRS WR adalah V(Ŷsrs)= N2 s2n , dimana s2(Ŷ)=NiNyi2-NY2 Sehingga VYsrs=NniNyi2-NY2 Sebuah penduga tidak bias dari iNyi adalah , sedangkan salah satu penduga tidak bias dari NY2 adalah Ypps2-v(Ypps2) , maka Varians SRS WR berdasarkan sampel PPS WR adalah vppsYsrs=Nn1ninyi2pi-NnnY2 = Nn2inyi2pi-Ypps2-v(Ypps2) =Nn2inyi2pi-Ypps2+vYpps2 =1n2Ninyi2pi- nYpps2+1nvYpps

Sehingga relative efficiency atau design effect adalah RE=v(Ypps)vppsYpps×100% b. Estim Estimasi asi terur terurut ut Des Des Raj Raj

Z1 =

dan z2 = y1 + y2  y i

(1 −  p 2 )

 pi

 p 3

ŶORD = 1

1

( z 1 +  z 2 ) =  y1 2 2

(1 +  p1 )



 p1

+  y 2

(1 −  p1 )   p 2

 

Teorema 1.1 Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dan varian sampling diberikan oleh V(ŶORD) = 2    1  N  Y i  y i   1  N  2   1  N    − Y ) 2  pi2  pi  − ∑ ( 1 − ∑ P 1   ∑  − Y       2 1   2 1   pi    4 1  pi

Bukti : E(z1) =

  y i   ∑    pi     pi = ∑ yi = Y  E2

=

 (1 −  p1 )  y 2  p 2 

 

y1 

E2



 y  j

(1 −  pi )

 p  j

 p  j

(1 −  pi )

= Y – y1

 (1 −  p1 )  y 2  p 2 

 

y1 

E(z2) = E1E2 (z2|y1) = y1+ Y – y1 = Y

E(ŶORD) = Y V(z1) = 2

  yi  y j    p p ∑ ∑ i j   pi − p j    i> j    V(z2) = E1V2 (z2) + V1E2(z2) E2(z2) = Y ,

V1E2 (z2) = 0

V(z2) = 2

∑∑ i> j

  y  y j   pi pj  i −   pi p j     ( 1− pi −   

pj )

Sehingga varian dari ŶORD adalah: V(ŶORD) = 2

  yi  y  j     1  2 −  pi − p ∑  p i  p  j  −   ∑ ∑    4 i> j   pi  p  j    

       

Dan estimator tidak bias dari V(ŶORD) adalah : V(ŶORD) =

  y ( 1z− 2z) = ( 1− p1 )  1 − 4 4   p1

1

2

1

2

2

    p2   y2

Teorema 1.2 Dalam pps sampling WOR, estimator estimator ŶORD adalah estimator tak bias dari total populasi Y dan variasi samplingnya yang diberikan oleh

V (YˆD ) =

1 n

2

∑ ∑ p p ( y  p − y i

j

 j

i

i

i >i

2 ) 1 + rij (1) + ...+ rij (k ) + ...+ rij (n − 1)} pj {

Dimana rijk adalah peluang bahwa yi dan yj tidak termasuk dalam deret.  Bukti

Telah diketahui bahwa Ezi=Y

Dan Ezi|y1, y2, …, yi-1=Y,i=2, …, n

Karenanya

Ezi=Y

untuk i=2, …, n

Mengik Mengikuti uti bahwa bahwa  YD=z=inzin adal adalah ah sebu sebuah ah esti estima mato torr tak tak bias bias.. Selan Selanju jutn tnya ya,, untuk untuk me memp mpero erole lehh varia variann sampl samplin ingg kita kita dapat dapat me meli liha hatt bahwa bahwa Ezizj=Y2 , yang mana menunjukkan bahwa zi dan zj tidak berkorelasi. Karenanya,

deng dengan an perl perlak akua uann yang yang seru serupa pa,, dapa dapatt dipe dipero role lehh hasi hasiln lnya ya.. Untu Untukk lebi lebihh mend me ndet etai ailn lnya ya,, pemb pembaha ahasa sann ini ini ditu dituju juka kann pada pada Des Des Raj Raj (1966) (1966).. Meski Meskipun pun  perhitungan untuk  VYORD agak kompleks, namun dapat dimodifikasi menjadi  bentuk yang lebih sederhana seperti berikut VYORD=Vinzin=1n2inVzi

Dan estimasi tidak bias dari V(ŶORD) bisa ditulis : v(Yˆ D ) =

n

∑ i

( zi

− z )2 n

( n −1)

c. Penduga Penduga Tidak Tidak Teru Terurut rut Horvitz Horvitz-Tho -Thompso mpson n

Sebuah sampel penduga berukuran n unit dipilih tanpa pengembalian dengan beberapa metode. Misalkan

π i=probabilita bahwa unit ke-i ada dalam sampel πij=probabilita bahwa unit ke-i dank e- j j keduanya berada dalam sampel hubungan berikut terpenuhi : (1.1)  N 



π   i

=n

i

 N 



π   ij

 N 

∑∑

= (n − 1)π  i

 j ≠ i

i

π  ij

=

 j >i

1 2

n(n − 1)

Untuk membentuk hubungan kedua, misalkan P(s) menyatakan probabilita dari sebuah sampel yang terdiri atas n unit tertentu. Maka πij =

seluruh

∑ P ( s) sampel yang terdiri atas unit ke-i dan unit ke- j j, serta πi =

seluruh sampel

∑ P ( s) yang terdiri atas unit ke-i. Bila kita mengambil

 j≠i, setiap P(s) untuk  untuk  j≠i,



π   ij

sebuah sampel yang terdiri atas unit ke-i dihitung (n-1) kali pada jumlahnya, karena ada (n-1) nilai lainnya dari j dalam sampel. Ini membuktikan hubungan yang kedua. Hubungan ketiga mengikuti hubungan kedua. Penduga Horvitz dan Thompson (1952) tentang jumlah populasi adalah: ŶHT =

(1.2) n

∑  y i

i

π  i

Dimana yi adalah pengukuran untuk unit ke-i. Teorema : Jika πi>0,(i=1,2,….,N)

ŶHT = n

∑  y i

i

π  i

Adalah sebuah penduga tidak bias dari Y, dengan varians V(ŶHT) =

(1.3)  N 

∑ i =1

(1 − π  i ) π  i

 y i

2



 N 

+ 2∑ ∑

(π  ij

i =1  j >i

− π  i π   j ) π  i π   j

 y i y  j

Dimana πij adalah probabilita bahwa unit ke-i dan ke- j j berada dalam sampel. Bukti : Misalkan t i (i = 1,2,….,N) merupakan sebuah variable acak yang mempunyai nilai 1 jika unit ke-i diambil dan bernilai nol untuk lainnya. Maka t i mengikuti distribusi binomial untuk sebuah sampel berukuran 1, dengan  probabilita πi . maka , E(t i) = πi V(t i) = πi (1- πi)  Nilai kovarians (t it  j) juga di gunakan. Karena t it  j adalah 1 hanya jika kedua unit mencul dalam sampel , , Kov (t it  j) = E(t it  j) – E(t i)E(t  j) = πij - πi π j Karena yi tetap dan t i sebagai variable acak, E(ŶHT) = E

   N  t i y i   N   ∑    y i = Y   = ∑ π  i = − i i 1 1    

(1.4)

V(ŶHT) = 2

 N   N    yi    y i    ( ) 2 V  t  + ∑i   π  i    i ∑i ∑  j >i π  i  N 

 y  j π   j

 Kov(t i t  j )

=

(1.5)  N 



(1 − π  i ) π  i

i =1

 y i

2

+2



 N 

∑∑

(π  ij

− π  i π   j ) π  i π   j

i =1  j > i

 y i y  j

Ini membuktikan teorema. Varians di atas dapat dinyatakan dalam bentuk lain dengan menggunaka dua hubungan pertama. Ini memberikan

∑(

π  ij

− π  i π   j ) = (n − 1)π  i − π   j (n − π  i ) = −π  i (1 − π  i )

 j ≠ i

Dengan menggantikan (1- πi) pada suku pertama dalam (1.5) V(ŶHT) =

  y  2   y j  2  y  y j  (π  i π   j − π  ij )  i   +    −2 i  ∑i ∑      π  i    π   j   π  i π   j   j > i    N   N 

=

(1.6) 2

  y i  y  j    −   ( ) − π   π   π   ∑i ∑ i  j ij     j >i  π  i π  j    N 

Kesimpulan :

 N 

Dari (1.5), dengan menggunakan metode t i , sebuah penduga

sampel yang tidak bias dari V(ŶHT) terlihat menjadi.

V 1(ŶHT)= = n



(1 − π  i )

i =1

π  i

2

 y i

2

n

n

+ 2∑ ∑ i =1  j > i

(π  ij

− π  i π   j )

π  i π   j π  ij

 y i y  j

Membuktikan bahwa tidak satu pun dari πij dalam populasinya yang hilang. Sebuah penduga sampel yang berbeda telah di berikan oleh Yates dan Grundy (1953) dan oleh Sen (1953). Dari (1.6), penduga ini adalah V 2(ŶHT) = n

n

i

 j >i

∑∑

2

  − π  ij )     yi − y  j      π  ij  π  i π  j  

(π  i π   j

Dengan batasan yang sama pada πij , Karena suku (πi π j - πij) sering bervariasi secara besar dan kadang-kadang negatif, v1dan v2 cenderung menjadi tidak stabil. Kedua penduga dapat mempunyai nilai negatif untuk bberapa metode pemilihan sampel. Rao dan Singh (1973) membandingkan koefisien variasi v1dan v2 dengan sampel n=2 sampel 34 dari  populasi alamiah kecil yang didapat dalam buku-buku dan majalah sampel survey, dengan menggunakan metode pemilihan sampel Brewer, untuk πi = 2 z i seperti yang diiinginkan. Penduga v2 dianggap lebih stabil dan selalu ≥ 0 untuk metode ini, sedangkan vi seringkali mempunyai nilai negative. d. PPS Stratified Phi=XhiXhi phi=xhixhi

Asumsikan Asumsikan sampel nh diambil dari Nh unit terhadap strata ke h dengan pps wr, ukurannya adalah x. Dimana  Yhi dan Phi=XhiXh suatu nilai, dan probability  pemilihan i unit pada strata ke h dan yhidan phi adalah sampel maka estimator  unbiased bagi Y adalah:

  YPPS= hLYh=h=1L1nhi=1nhyhiphi=h=1LXhnhi=1nhyhixhi

Dengan v YPPS YPPS= = h=1L h=1LYh Yhii-Yh Yh2n 2nnn-1= 1=1n 1nnn-1h 1h= =1Lyh 1Lyhip iphi hi-Y -Yh2 h2= = 1nn1nn1h=1Lyh 1h=1Lyhiphi iphi2+i= 2+i=1nYh 1nYh2-2 2-2 Yh n Yh=1nnYh=1nn-1h=1 1h=1Lyhi Lyhiphi2 phi2+n +n Yh2-2 Yh2-2 Yh n  Yh=1nn-1h=1Lyhiphi2+n Yh2-2 n Yh2=1nn-1h=1Lyhiphi2- n Yh2

Dan  YPPS=YPPShL Nh=hL Xhnh inh yhixhihLNh =hL Xhnhinh yhixhi . 1hLNh =hL XhnhNh inh yhixhi

Stratifikasi menjadi strata efektif apabila diambil dari strata yang unit dari masing-masing strata yang homogen, yang bersesuaian dengan variabel yhixhi atau YhiXhi dan tidak bersesuaian dengan variabel variabel y dan x yang diambil terpisah. terpisah. Karena nilai Yhitidak mungkin tersedia dalam praktek maka sangat penting untuk  menggunakan pada nlai rasio pada periode sebelumnya atau nilai dari karakteristik  yang berhubungan dengan tujuan stratifikasi.

Sumber: Murthy Daroga singh: Cochran www.iccid.org/.../survey-sites.pdf  www.amstat.org/.../JSM2002-000704.pdf 

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF