January 26, 2019 | Author: Irdiena Izza Ell Milla | Category: N/A
Download Sampling With Probability Proportional to Size (Pps...
SAMPLING WITH PROBABILITY PROPORTIONAL TO SIZE (PPS SAMPLING) Contact:
[email protected]
A. Defini inisi
PPS Sampli Sampling ng adalah adalah suatu suatu metode metode pengam pengambil bilan an sampel sampel dari sebuah sebuah populasi dimana peluang terpilihnya setiap unit sampel sebanding dengan ukuran. Ukuran tersebut adalah informasi tambahan yang dimiliki dimiliki oleh setiap setiap unit sampel yang yang dijadi dijadikan kan sebagai sebagai dasar dasar pertim pertimban bangan gan dalam dalam penarik penarikan an sampel sampel sehingga sehingga dapat diperoleh estimator-estimator yang lebih efisien. Info Inform rmasi asi tamb tambah ahan an (ukur (ukuran) an) yang yang bergu berguna na untuk untuk dija dijadi dika kann dasar dasar pertimbangan penarikan sampel adalah inform,asi yang mempunyai korelasi yang kuat dengan variabel-variabel yang akan diteliti. B. Keunt euntun unga gan n
Keuntungan yang dapat diperoleh dari PPS Sampling, yaitu: Akan diperoleh estimator yang unbiased terhadap populasi. Dapa Dapatt member memberik ikan an esti estima mato tor-a r-ast stim imat ator or yang yang lebih lebih sede sederha rhana na..
1.
2. 3.
Mempuny Mempunyai ai akura akurasi si yang yang lebih lebih ting tinggi gi diba dibandi ndingk ngkan an meto metode-m de-meto etode de lain lain.. A. Kerug erugia ian n
1.
Pemi Pemili liha hann
samp sampel el deng dengan an me meng nggu guna naka kann pros prosed edur ur With Out Replacement (WOR) lebih sulit dilakukan.
A. Kondi Kondisi si Pengg Pengguna unaan an
PPS PPS Samp Sampli ling ng digu digunak nakan an pada pada saat saat setia setiapp unit unit sampe sampell dalam dalam popul populasi asi memiliki ukuran yang bervariasi sehingga peluang terpilihnya sampel tidak sama. Semaki Semakinn besar besar ukuran ukuran suatu suatu unit unit sampel sampel,, maka maka semakin semakin besar pula pula peluang peluang terpilihnya unit sampel tersebut. Selain itu, penggunaan PPS Sampling harus
memperhatikan ada tidakanya hubungan yang kuat antara informasi tambahan (ukuran) yang dimiliki oleh setiap unit sampel dengan variabel-variabel yang ingin diteliti. B. Kasus Kasus Pengg Penggun unaa aan n
Variabel yang Diteliti
Informasi Tambahan (Ukuran)
Rata-rata pengeluaran pulsa per bulan
Jumlah handphone yang dimiliki
Jumlah produksi sebuah pabrik
Jumlah pekerja yang dimiliki
Rata-rata indeks prestasi mahasiswa
Lamanya jam belajar
C. Pemilihan Pemilihan Sampel Sampel Dari Suatu Daftar (LIST) 1. Metode Kumulat latif
• membuat frekuensi kumulatif dari ukuran yang dijadikan dasar penari penarikan kan sampel sampel untuk untuk seluruh seluruh unit unit dalam dalam popula populasi si (jumla (jumlahh kumulatif dari ukuran auxiliary information) untuk seluruh unit dalam populasi. • Mengambil suatu angka random dari 1 sampai Z • Bila i-1ziiNyipiyjpjKovtitj
=1n2ni=1Nyipi2pi1- pi+2i=1Nj>iNyipiyjpj∙0 =1n2 ni=1Nyipi2pi1- pi VYPPS=1ni=1Nyipi2pi-yipi2p12 =1ni=1Nyi2pi-yi2 VYPPS=1ni=1Nyi2pi-Y2 =1ni=1Npiyi2pi-Y2
dengan i=1Npi=1. Jadi, VYPPS tidak bias.
Penduga yang tidak bias bagi VYPPS adalah vYPPS=1n(n-1)i=1nyixi-YPPS2
Bukti: i=1nyixi-YPPS2=i=1nyixi-Y2-nYPPS-Y2
selanjutnya nn-1vYPPS=i=1nyixi-YPPS2 Enn-1vYPPS=Ei=1nyixi-Y2-nYPPS-Y2 nn-1EvYPPS=Ei=1Ntiyizi-Y2-n VYPPS nn-1EvYPPS =ni=1npiyipi-Y2-n VYPPS =n∙n VYPPS-n VYPPS =n2VYPPS-n VYPPS =nn-1VYPPS
EvYPPS=VYPPS
dila YPPS=1n i=1nyipi pi=xiX X=i=1Nxi
Merupa Merupakan kan perki perkira raan an yang yang tidak tidak bias bias terhad terhadap ap Y dengan dengan varians V (YPPS)=1n i=1npi yipi- Y2
Bukti : Misalkan ti= jumlah waktu ; i= 0, 1, 2, ..., n Sehingga distribusi frekuensi gabungan dari ti untuk N unit dan populasinya adalah pada saat n dimasukkan ke dalam kotak ke-i ke -i adal adalah ah pi pada pada seti setiap ap pema pemasuk sukan an,, sehi sehing ngga ga dist distri ribu busi si gabungan ti adalah rumus multinomial n!t1!t2!… tN! p1t1p2t2… pNtN
Sehingga diketahui E(ti) = n pi V(ti) = n pi (1-pi) Cov(t1,t2) = -n pi pj Sehing Sehingga ga : jika jika sebuah sebuah sampel sampel beruku berukuran ran n unit unit diambi diambill dengan probabilita pi, dengan pengembalian maka YPPS=1n i=1nyipi YPPS=1n t1y1p1+t2y2p2+…+tNyNpN=1n i=1Nti yipi
t adalah variabel acak, yi dan pi adalah sekumpulan bilangan tetap
E(ti) = n pi E( YPPS YPPS)= 1n i=1nnpi yipi=i=1nyi=Y Sehingga YPPS tidak bias V YPPS= YPPS= 1n2 i=1nVyip i=1nVyipi=1n i=1n2i= 2i=1nj= 1nj=1NYj 1NYjPj-Y2 Pj-Y2Pj=1 Pj=1n n i=1N i=1N YiPiYiPi Y2Pi= 1n i=1N Yi2Pi2- Y2
Nilai Covarians Covyipi , yjpj , jika j ≠ i, akan menjadi 0. Ini menunj menunjukk ukkan an bahwa bahwa varian varians s estim estimato atorr adala adalah h propor proporti ti yang yang berkebalikan dengan ukuran sampel (n) pada SRS WR Jika Jika sebu sebuah ah samp sampel el beru beruku kura ran n n unit unit diam diambi bill deng dengan an probabili probabilita ta proporsio proporsional nal terhadap terhadap ukuran, ukuran, degan degan pengembal pengembalian ian (WR) : pi=xiX dan dengan pengembalian YPPS=1n i=1nyipi YPPS=Xn i=1nyixi= Xn i=1nyi=Xy
adalah rata-rat rata-rata a tak tertimba tertimbang ng dari rata-rat rata-rata a unitnya unitnya y adalah adalah perkiraan yang tak bias dari Y dengan varians V(YPPS)=Xn i=1nxi( yi-Y)2 yi= yixi Y=YX Y=YPPSX=NnXi=1nyi YR= YRX=i=1nyii=1nxi = rata-rata sampel per elemen
Sehingga, unbiased estimator dari rata-rata populasinya : YPPS=yN=1n Ni=1nyipi= Xn Ni=1nyixi
Unbiased Unbiased estimator estimator V(YPPS) pada pada PPS PPS Samp Sampli ling ng WR nya nya adalah :
v YPPS= i=1nYi-Y2nn-1=1nn-1i=1nyipi-Y2= 1nn1i=1nyipi2+i=1nYPPS2-2 YPPS n YPPS u=1nn-1i=1nyipi2+ n YPPS2-2 n YPPS2= 1nn-1i=1nyipi2+ n YPPS2
Dan Unbiased estimator V(YPPS) pada PPS Sampling WR nya adalah : v YPPS= 1nn-1i=1nyiN pi-YPPS2 = 1nn-1i=1nyiNpi2+ i=1nYPPS22 YPPS YPPS i=1ny i=1nyiNp iNpii =1nn=1nn-11N 11N2i= 2i=1ny 1nyip ipi2+ i2+ n YPPS2YPPS2-2 2 n YPPS2= YPPS2= 1nn1nn11N2i=1n 11N2i=1nyipi yipi2+ 2+ n YPPS2 YPPS2 = 1nn-11N2 1nn-11N2i=1n i=1nyipi yipi2+ 2+ n YPPS2N2 YPPS2N2 =1nn=1nn1N2i=1nyipi2+ n YPPS2 a. Koefisi Koefisien en relat relative ive / relativ relativee effici efficiency ency
Perbandingan sampling PPS WR dan SRS WR dengan sampel yang sama dapat diketahui. Seperti yang diketahui sebelumnya, varians dari SRS WR adalah V(Ŷsrs)= N2 s2n , dimana s2(Ŷ)=NiNyi2-NY2 Sehingga VYsrs=NniNyi2-NY2 Sebuah penduga tidak bias dari iNyi adalah , sedangkan salah satu penduga tidak bias dari NY2 adalah Ypps2-v(Ypps2) , maka Varians SRS WR berdasarkan sampel PPS WR adalah vppsYsrs=Nn1ninyi2pi-NnnY2 = Nn2inyi2pi-Ypps2-v(Ypps2) =Nn2inyi2pi-Ypps2+vYpps2 =1n2Ninyi2pi- nYpps2+1nvYpps
Sehingga relative efficiency atau design effect adalah RE=v(Ypps)vppsYpps×100% b. Estim Estimasi asi terur terurut ut Des Des Raj Raj
Z1 =
dan z2 = y1 + y2 y i
(1 − p 2 )
pi
p 3
ŶORD = 1
1
( z 1 + z 2 ) = y1 2 2
(1 + p1 )
p1
+ y 2
(1 − p1 ) p 2
Teorema 1.1 Dalam pps sampling WOR, estimator ŶORD adalah estimator tak bias dan varian sampling diberikan oleh V(ŶORD) = 2 1 N Y i y i 1 N 2 1 N − Y ) 2 pi2 pi − ∑ ( 1 − ∑ P 1 ∑ − Y 2 1 2 1 pi 4 1 pi
Bukti : E(z1) =
y i ∑ pi pi = ∑ yi = Y E2
=
(1 − p1 ) y 2 p 2
y1
E2
∑
y j
(1 − pi )
p j
p j
(1 − pi )
= Y – y1
(1 − p1 ) y 2 p 2
y1
E(z2) = E1E2 (z2|y1) = y1+ Y – y1 = Y
E(ŶORD) = Y V(z1) = 2
yi y j p p ∑ ∑ i j pi − p j i> j V(z2) = E1V2 (z2) + V1E2(z2) E2(z2) = Y ,
V1E2 (z2) = 0
V(z2) = 2
∑∑ i> j
y y j pi pj i − pi p j ( 1− pi −
pj )
Sehingga varian dari ŶORD adalah: V(ŶORD) = 2
yi y j 1 2 − pi − p ∑ p i p j − ∑ ∑ 4 i> j pi p j
Dan estimator tidak bias dari V(ŶORD) adalah : V(ŶORD) =
y ( 1z− 2z) = ( 1− p1 ) 1 − 4 4 p1
1
2
1
2
2
p2 y2
Teorema 1.2 Dalam pps sampling WOR, estimator estimator ŶORD adalah estimator tak bias dari total populasi Y dan variasi samplingnya yang diberikan oleh
V (YˆD ) =
1 n
2
∑ ∑ p p ( y p − y i
j
j
i
i
i >i
2 ) 1 + rij (1) + ...+ rij (k ) + ...+ rij (n − 1)} pj {
Dimana rijk adalah peluang bahwa yi dan yj tidak termasuk dalam deret. Bukti
Telah diketahui bahwa Ezi=Y
Dan Ezi|y1, y2, …, yi-1=Y,i=2, …, n
Karenanya
Ezi=Y
untuk i=2, …, n
Mengik Mengikuti uti bahwa bahwa YD=z=inzin adal adalah ah sebu sebuah ah esti estima mato torr tak tak bias bias.. Selan Selanju jutn tnya ya,, untuk untuk me memp mpero erole lehh varia variann sampl samplin ingg kita kita dapat dapat me meli liha hatt bahwa bahwa Ezizj=Y2 , yang mana menunjukkan bahwa zi dan zj tidak berkorelasi. Karenanya,
deng dengan an perl perlak akua uann yang yang seru serupa pa,, dapa dapatt dipe dipero role lehh hasi hasiln lnya ya.. Untu Untukk lebi lebihh mend me ndet etai ailn lnya ya,, pemb pembaha ahasa sann ini ini ditu dituju juka kann pada pada Des Des Raj Raj (1966) (1966).. Meski Meskipun pun perhitungan untuk VYORD agak kompleks, namun dapat dimodifikasi menjadi bentuk yang lebih sederhana seperti berikut VYORD=Vinzin=1n2inVzi
Dan estimasi tidak bias dari V(ŶORD) bisa ditulis : v(Yˆ D ) =
n
∑ i
( zi
− z )2 n
( n −1)
c. Penduga Penduga Tidak Tidak Teru Terurut rut Horvitz Horvitz-Tho -Thompso mpson n
Sebuah sampel penduga berukuran n unit dipilih tanpa pengembalian dengan beberapa metode. Misalkan
π i=probabilita bahwa unit ke-i ada dalam sampel πij=probabilita bahwa unit ke-i dank e- j j keduanya berada dalam sampel hubungan berikut terpenuhi : (1.1) N
∑
π i
=n
i
N
∑
π ij
N
∑∑
= (n − 1)π i
j ≠ i
i
π ij
=
j >i
1 2
n(n − 1)
Untuk membentuk hubungan kedua, misalkan P(s) menyatakan probabilita dari sebuah sampel yang terdiri atas n unit tertentu. Maka πij =
seluruh
∑ P ( s) sampel yang terdiri atas unit ke-i dan unit ke- j j, serta πi =
seluruh sampel
∑ P ( s) yang terdiri atas unit ke-i. Bila kita mengambil
j≠i, setiap P(s) untuk untuk j≠i,
∑
π ij
sebuah sampel yang terdiri atas unit ke-i dihitung (n-1) kali pada jumlahnya, karena ada (n-1) nilai lainnya dari j dalam sampel. Ini membuktikan hubungan yang kedua. Hubungan ketiga mengikuti hubungan kedua. Penduga Horvitz dan Thompson (1952) tentang jumlah populasi adalah: ŶHT =
(1.2) n
∑ y i
i
π i
Dimana yi adalah pengukuran untuk unit ke-i. Teorema : Jika πi>0,(i=1,2,….,N)
ŶHT = n
∑ y i
i
π i
Adalah sebuah penduga tidak bias dari Y, dengan varians V(ŶHT) =
(1.3) N
∑ i =1
(1 − π i ) π i
y i
2
N
N
+ 2∑ ∑
(π ij
i =1 j >i
− π i π j ) π i π j
y i y j
Dimana πij adalah probabilita bahwa unit ke-i dan ke- j j berada dalam sampel. Bukti : Misalkan t i (i = 1,2,….,N) merupakan sebuah variable acak yang mempunyai nilai 1 jika unit ke-i diambil dan bernilai nol untuk lainnya. Maka t i mengikuti distribusi binomial untuk sebuah sampel berukuran 1, dengan probabilita πi . maka , E(t i) = πi V(t i) = πi (1- πi) Nilai kovarians (t it j) juga di gunakan. Karena t it j adalah 1 hanya jika kedua unit mencul dalam sampel , , Kov (t it j) = E(t it j) – E(t i)E(t j) = πij - πi π j Karena yi tetap dan t i sebagai variable acak, E(ŶHT) = E
N t i y i N ∑ y i = Y = ∑ π i = − i i 1 1
(1.4)
V(ŶHT) = 2
N N yi y i ( ) 2 V t + ∑i π i i ∑i ∑ j >i π i N
y j π j
Kov(t i t j )
=
(1.5) N
∑
(1 − π i ) π i
i =1
y i
2
+2
N
N
∑∑
(π ij
− π i π j ) π i π j
i =1 j > i
y i y j
Ini membuktikan teorema. Varians di atas dapat dinyatakan dalam bentuk lain dengan menggunaka dua hubungan pertama. Ini memberikan
∑(
π ij
− π i π j ) = (n − 1)π i − π j (n − π i ) = −π i (1 − π i )
j ≠ i
Dengan menggantikan (1- πi) pada suku pertama dalam (1.5) V(ŶHT) =
y 2 y j 2 y y j (π i π j − π ij ) i + −2 i ∑i ∑ π i π j π i π j j > i N N
=
(1.6) 2
y i y j − ( ) − π π π ∑i ∑ i j ij j >i π i π j N
Kesimpulan :
N
Dari (1.5), dengan menggunakan metode t i , sebuah penduga
sampel yang tidak bias dari V(ŶHT) terlihat menjadi.
V 1(ŶHT)= = n
∑
(1 − π i )
i =1
π i
2
y i
2
n
n
+ 2∑ ∑ i =1 j > i
(π ij
− π i π j )
π i π j π ij
y i y j
Membuktikan bahwa tidak satu pun dari πij dalam populasinya yang hilang. Sebuah penduga sampel yang berbeda telah di berikan oleh Yates dan Grundy (1953) dan oleh Sen (1953). Dari (1.6), penduga ini adalah V 2(ŶHT) = n
n
i
j >i
∑∑
2
− π ij ) yi − y j π ij π i π j
(π i π j
Dengan batasan yang sama pada πij , Karena suku (πi π j - πij) sering bervariasi secara besar dan kadang-kadang negatif, v1dan v2 cenderung menjadi tidak stabil. Kedua penduga dapat mempunyai nilai negatif untuk bberapa metode pemilihan sampel. Rao dan Singh (1973) membandingkan koefisien variasi v1dan v2 dengan sampel n=2 sampel 34 dari populasi alamiah kecil yang didapat dalam buku-buku dan majalah sampel survey, dengan menggunakan metode pemilihan sampel Brewer, untuk πi = 2 z i seperti yang diiinginkan. Penduga v2 dianggap lebih stabil dan selalu ≥ 0 untuk metode ini, sedangkan vi seringkali mempunyai nilai negative. d. PPS Stratified Phi=XhiXhi phi=xhixhi
Asumsikan Asumsikan sampel nh diambil dari Nh unit terhadap strata ke h dengan pps wr, ukurannya adalah x. Dimana Yhi dan Phi=XhiXh suatu nilai, dan probability pemilihan i unit pada strata ke h dan yhidan phi adalah sampel maka estimator unbiased bagi Y adalah:
YPPS= hLYh=h=1L1nhi=1nhyhiphi=h=1LXhnhi=1nhyhixhi
Dengan v YPPS YPPS= = h=1L h=1LYh Yhii-Yh Yh2n 2nnn-1= 1=1n 1nnn-1h 1h= =1Lyh 1Lyhip iphi hi-Y -Yh2 h2= = 1nn1nn1h=1Lyh 1h=1Lyhiphi iphi2+i= 2+i=1nYh 1nYh2-2 2-2 Yh n Yh=1nnYh=1nn-1h=1 1h=1Lyhi Lyhiphi2 phi2+n +n Yh2-2 Yh2-2 Yh n Yh=1nn-1h=1Lyhiphi2+n Yh2-2 n Yh2=1nn-1h=1Lyhiphi2- n Yh2
Dan YPPS=YPPShL Nh=hL Xhnh inh yhixhihLNh =hL Xhnhinh yhixhi . 1hLNh =hL XhnhNh inh yhixhi
Stratifikasi menjadi strata efektif apabila diambil dari strata yang unit dari masing-masing strata yang homogen, yang bersesuaian dengan variabel yhixhi atau YhiXhi dan tidak bersesuaian dengan variabel variabel y dan x yang diambil terpisah. terpisah. Karena nilai Yhitidak mungkin tersedia dalam praktek maka sangat penting untuk menggunakan pada nlai rasio pada periode sebelumnya atau nilai dari karakteristik yang berhubungan dengan tujuan stratifikasi.
Sumber: Murthy Daroga singh: Cochran www.iccid.org/.../survey-sites.pdf www.amstat.org/.../JSM2002-000704.pdf