REGRESI LOGISTIK

February 15, 2019 | Author: IdaAyu Dyantari Ari Putri | Category: N/A
Share Embed Donate


Short Description

Download REGRESI LOGISTIK...

Description

REGRESI LOGISTIK 

Regresi logistik merupakan pengembangan lebih lanjut sebagai multivariat chi square yaitu variabel dependentnya dalam skala data nominal (dikotomis ). Regresi logistik termasuk  dalam rumpun dari regresi sehingga kedudukannya sama dengan regresi linier, sebagai uji   predi prediksi ksi atau atau estima estimasi, si, namun namun secara secara sederh sederhana ana perbed perbedaan aan antara antara regres regresii biasa biasa dengan dengan  pemodelan logit ialah hanya pada variabel dependen atau responnya. Dimana pada regresi  biasa dengan pemodelan logit ialah hanya pada variabel dependen dan responnya. Dimana   pada regresi biasa, data variabel berupa data kontinyu, namun pada regresi logistik, data variabel dependennya berupa kategorik, baik Biner ( seperti Ya atau Tidak ) yang sering disebut dikotomus, atau juga polycotomus ( seperti sangat setuju, setuju, biasa, tidak setuju, dan sangat tidak setuju ), namun yang sering digunakan adalah untuk variabel dependen dikotomus. Model logit logit berdasarkan berdasarkan dari ide linier linier probability probability model model (LPM ), yaitu Y = b₀ + b₁X + u misalnya misalnya variabe variabell X adalah adalah usia sedang sedangkan kan variabe variabell Y kejadi kejadian an ca pulmo pulmo ( kanker  kanker   pulmo)dimana 0 = tidak terjadi ca pulmo, 1 = tidak terjadi ca pulmo. Regresi linier tidak  mampu menyelesaikan analisis ini, namun LPM dapat menyelesaikan analisis ini dengan cara ekspektasi kondisional Y dari X, dapat diinterpretasikan sebagai probabilitas kondisional saat suatu event Y akan muncul karena X, atau dituliskan dengan E(Yix), yang didefinisikan :  p=P(Y) P=(Y=1IX=x), maka E(YIx)=p.1 E(YIx)=p.1 + ( 1-p )*0=p untuk memenuhi konsep LPM , sangat sulit karena terkadang nilai dari P berada diluar range 0-1, 0-1, sedang sedangkan kan nilai nilai R² umumny umumnyaa kecil, kecil, sehing sehingga ga perlu perlu dibuat dibuat pemode pemodelan lan logit logit untuk  untuk  menyelesaikan kelemahan-kelemahan yang ada dalam LPM. Untuk membuat harga p selalu berada diantara 0 dan 1, maka perlu suatu fungsi monoton positif, yang memtakan linier prediktor h= a+bX ke unit interval. Transformasi tipe ini akan mempertahankan struktur linier dari model dan menghindari nilai peluang berada diluar interval [0,1]. Fungsi distribusi kumulatif (CDF= cummulative distributions function) akan memnuhi kriteria di atas. p=P(Y) P=(Y=1IX=x), P(h)= P(a+bX)

dengan dengan menggu menggunak nakan an fungsi fungsi logist logistik, ik, dipero diperoleh leh linier linier regres regresion ion atau linier linier logit logit model, model, dengan rumus sebagai berikut :

p=

=

=

1

maka untuk rumus regresi logistik adalah

p= E (Y=1IX )=

untuk mencari odd ratio / OR ( sebagai faktor resiko ), maka dapat dicari dari harga b yang telah diketahui , maka rumus mencari OR adalah OR=

Dimana e adalah bilangan natural yang besarnya adalah 2,718 Contoh :

sebuah penelitian bertujuan ingin mencari faktor-faktor yang mempengaruhi kejadian kanker   pulmo ( ca pulmo ), dianalisis variabel independen adalan kebiasaan merokok, usia, riwayat keluarga ca pulmo dan daerah asal tinggal. Adapun data yang dikumpulkan adalah sebagai  berikut: CA PULMO tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo capulmo capulmo capulmo capulmo capulmo capulmo

PEROKOK tak merokok tak merokok tak merokok tak merokok tak merokok tak merokok tak merokok merokok tak merokok tak merokok tak merokok tak merokok merokok merokok merokok merokok merokok merokok merokok merokok

USIA 45 43 34 34 26 27 27 28 29 29 30 31 32 33 45 45 46 47 8 57 2

RIWAYAT KELUARGA tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca ada riwayat ca tdk ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca

DAERAH desa desa desa desa kota kota kota kota kota kota desa desa desa desa desa desa desa desa desa kota

capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo

merokok merokok tak merokok tak merokok tak merokok tak merokok merokok merokok merokok merokok

57 54 55 48 49 59 37 57 58 59

ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca ada riwayat ca

kota kota kota kota kota kota kota kota desa desa

Keterangan data dari variabel dimana dari variabel ca pulmo , ca pulmo=1; tidak ca pulmo=0,   pada variabel umur berskala data interval, pada variabel perokok, tak merokok=0 ; merokok=1,pada variabel daerah, desa=0 ; kota=1, pada variabel riwayat keluarga tidak ada riwayat ca=0; ada riwayat ca=1. Untuk menyelesaikan masalah diatas hanya dapat dikerjakan dengan regresi logistik karena variabelnya berupa variabel dikotomi untuk variabel ca pulmo,  perokok, daerah dan riwayat keluarga. Sedangkan variabel usia distribusi data tidak normal. Soal ini dapat diselesaikan dengan menggunakan aplikasi SPSS (Statistical Package For  Social Science)

RIWAYAT CA PULMO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1

PEROKOK 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 1 1 1

USIA 45 43 34 34 26 27 27 28 29 29 30 31 32 33 45 45 46 47

KELUARGA 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 1 3

DAERAH 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0



8 1 1 57 1 1 57 1 1 54 1 1 55 1 0 48 1 0 49 1 0 59 1 0 37 1 1 57 1 1 58 1 1 59 1 1 Masukkan data tersebut ke dalam aplikasi SPSS

1 1 1 0 0 0 0 0 0 0 0 1

0 1 1 1 1 1 1 1 1 1 0 0



Analyze, pilih regression, binary logistik 



Isikan ca pulmo pada dependent



Sedangkan rokok, usia, riwayat keluarga dan daerah pada covariates selanjutnya klik  ok 



Maka akan tampil output seperti dibawah ini

Logistic Regression Case Processing Summary a

Unweighted Cases Selected Cases

N Included in Analysis Missing Cases Total

Unselected Cases Total

30

Percent 100,0

0

,0

30

100,0

0

,0

30

100,0

a. If weight is in effect, see classification table for the total number of cases.

Dependent Variable Encoding Original Value Internal Value tidak capulmo 0 capulmo 1

Block 0: Beginning Block 

4

Classification Tablea,b Predicted kanker pulmo Step 0

Observed kanker pulmo

tidak capulmo

tid ak ca pu lm o 0

ca pu lm o 14

Percentage Correct ,0

0

16

100,0

capulmo Overall Percentage

53,3

a. Constant is included in the model. b. The cut value is ,500

Variables in the Equation

Step 0

B ,134

Constant

S.E. ,366

Wald ,133

df 1

Sig. ,715

1

Sig. ,003

12,820

1

,000

RWYKLG

6,531

1

,011

DAERAH

,536

1

,464

19,306

4

,001

Exp(B) 1,143

Variables not in the Equation

Step 0

Variables

Score 8,571

ROKOK USIA

Overall Statistics

df

Block 1: Method = Enter Omnibus Tests of Model Coefficients

Step 1

Step

Chi-square 27,960

df 4

Sig. ,000

Block

27,960

4

,000

Model

27,960

4

,000

Model Summary

Step 1

-2 Log likelihood 13,496

Cox & Snell R Square ,606

Nagelkerke R Square ,810

Classification T ablea Predicted kanker pulmo Step 1

Observed kanker pulmo

tidak capulmo capulmo

Overall Percentage

tid ak ca pu lm o 13

ca pu lm o 1

Percentage Correct 92,9

1

15

93,8 93,3

a. The cut value is ,500

5

Variables in th e Equation

Step a 1

B 1,888

S.E. 1,628

Wald 1,344

,169

,063

RWYKLG

5,236

DAERAH Constant

ROKOK

1

Sig. ,246

Exp(B) 6,603

7,111

1

,008

1,184

3,086

2,877

1

,090

187,824

3,310

2,068

2,562

1

,109

27,393

-10,295

3,705

7,722

1

,005

,000

USIA

df

a. Variable(s) entered on step 1: ROKOK, USIA, RWYKLG, DAERAH.

d ari hasil diketahui bahwa semua variabel dimasukkan dalam hasil analisis, karena metode yang kita pakai adalah metode enter. Hasil menunjukkan bahwa variabel usia yang signifikan ( sig.= 0,010 ) sedangkan variabel lainnya sebagai variabel moderator atas terjadinya ca pulmo. Untuk mengetahui variabel mana yang berpengaruh atas ca pulmo, maka kita perlu melakukan analisis dengan metode forward, dimana dengan memasukkan variabel yang signifikan saja dalam analisis. Langkah analisis metode forward adalah : •

Langkah awal sama dengan langkah sebelumnya



Method diganti Forward Conditional



Lalu klik ok 



Maka akan tampil output seperti dibawah ini

Logistic Regression Case Processing Summary a

Unweighted Cases Selected Cases

N Included in Analysis Missing Cases Total

Unselected Cases Total

30

Percent 100,0

0

,0

30

100,0

0

,0

30

100,0

a. If weight is in effect, see classification table for the total number of cases.

Dependent Variable Encoding Original Value Internal Value tidak capulmo 0 capulmo 1

Block 0: Beginning Block 

6

Classification Tablea,b Predicted kanker pulmo Step 0

Observed kanker pulmo

tidak capulmo

tid ak ca pu lm o 0

ca pu lm o 14

Percentage Correct ,0

0

16

100,0

capulmo Overall Percentage

53,3

a. Constant is included in the model. b. The cut value is ,500

Variables in the Equation

Step 0

B ,134

Constant

S.E. ,366

Wald ,133

df 1

Sig. ,715

1

Sig. ,003

12,820

1

,000

RWYKLG

6,531

1

,011

DAERAH

,536

1

,464

19,306

4

,001

Variables not in the Equation

Step 0

Variables

Score 8,571

ROKOK USIA

Overall Statistics

Block 1: Method = Forward Stepwise (Conditional) Omnibus Tests of Model Coefficients

Step 1

Step 2

Step

Chi-square 15,640

df 1

Sig. ,000

Block

15,640

1

,000

Model

15,640

1

,000

6,407

1

,011

Block

22,047

2

,000

Model

22,047

2

,000

Step

Model Summary

Step 1 2

-2 Log likelihood 25,815

Cox & Snell R Square ,406

Nagelkerke R Square ,543

19,409

,520

,695

7

df

Exp(B) 1,143

Classification Tablea Predicted kanker pulmo Step 1

Observed kanker pulmo

tidak capulmo

tid ak ca pu lm o 12

ca pu lm o 2

Percentage Correct 85,7

2

14

87,5

capulmo Overall Percentage Step 2

kanker pulmo

86,7 tidak capulmo

12

2

85,7

1

15

93,8

capulmo Overall Percentage

90,0

a. The cut value is ,500

Variables in the Equation

B Step a 1

USIA

Step b 2

S.E.

Wald

df

Sig.

,156

,052

8,973

1

,003

1,169

Constant

-6,186

2,133

8,408

1

,004

,002

ROKOK

2,794

1,263

4,893

1

,027

16,352

,163

,064

6,519

1

,011

1,177

-7,728

2,895

7,125

1

,008

,000

USIA Constant

a. Variable(s) entered on step 1: USIA. b. Variable(s) entered on step 2: ROKOK.

a Model if Term Removed

Variable Step 1 USIA Step 2

ROKOK USIA

Model Log Likelihood -20,767

Change in -2 Log Likelihood 15,719

-13,403 -16,720

1

Sig. of the Change ,000

7,398

1

,007

14,032

1

,000

df  

a. Based on conditional parameter estimates

Variables not in the Equation

Step 1

Variables

Score 6,458

ROKOK

Variables

df 1

Sig. ,011

RWYKLG

5,713

1

,017

DAERAH

,365

1

,546

9,801

3

,020

RWYKLG

1,741

1

,187

DAERAH

1,301

1

,254

5,530

2

,063

Overall Statistics Step 2

Exp(B)

Overall Statistics

8

Dari hasil forward diketahui bahwa

variabel independen yang berpengaruh terhadap ca

 pulmo adalah rokok ( koefesiensi regresi= 2,794 , sig.=0,027) dan variabel usia ( koefisiensi regresi= 0,163, sig.=0,011 ) dengan konstanta -7,728. Sehingga persamaan regresinya adalah P = -7,728+ 2,794X ₁+0,163X₂ Interpretasi hasil dari model logit tersebut bukanlah nilai kuantitatif dari response melainkan sebagai probabilitas atau peluang terjadinya suatu kejadian atau event dalam hal ini adalah kejadian kanker pulmo (ca pulmo ), dengan persamaan distribusi komulatifnya adalah :

 p= E (Y=1IX )= Perlu diketahui bahwa besarnya (a+b ₁X₁+b₂X₂) = Z Sehingga E (Y=1IX ) dibaca harga harapan / peluang terjadinya suatu kejadian atau event, dengan nilai kuantitatif 1 dalam hal ini adalah terjadinya kanker paru ( ca pulmo ) dikarenakan suatu respon dengan input/ prediktor variabel X. Dari haril koefisien regresi yang diperoleh, dapat dicari •

OR untuk variabel yang signifikan (yaitu rokok dan usia )



OR untuk rokok adalah OR1=



OR untuk usia adalah OR2=

= =

= 16,34

= 1,17

Dari hasil tersebut diketahui bahwa riwayat perokok sebagai faktor resiko terhadap terjadinya ca pulmo sebesar 16,34. Sedangkan usia sebagai faktor resiko terjadinya ca pulmo sebasar  1,17. Contoh :

Jika terdapat seseorang dengan kriteria X ₁= perokok ( nilai= 1 ), dan X ₂=usia 30 tahun, maka kemungkinan terjadinya kanker paru-paru adalah Z= a+b₁X₁+b₂X₂ Z= -7,728+ 2,794X ₁+0,163X₂ Z= -7,728+( 2,794*1)+(0,163*30) Z= -7,728 + 2,794 + 4,89 Z= -7,728 + 7,684 Z= -0,044 9

Sehingga p= E (Y=1IX )=

Atau p= E (Y=1I X )=

Sehingga besar Z = -0,044 dengan e adalah bilangan natural dengan nilai 2,718, maka

 p= E (Y=1I X )=

 p= E (Y=1IX )=

 p= E (Y=1IX )=

 p= E (Y=1IX )=  jadi orang memiliki peluang sebesar 48,9% atau 49% untuk terjadi kanker paru-paru, dengan kondisi ia perokok dan berumur 30 tahun.

Jika terdapat seseorang dengan kriteria X₁=tidak perokok ( nilai= 0 ), dan X₂=usia 30 tahun, maka kemungkinan terjadinya kanker paru-paru adalah Z= a+b₁X₁+b₂X₂ Z= -7,728+ 2,794X ₁+0,163X₂ Z= -7,728+( 2,794*0)+(0,163*30) Z= -7,728 + 0 + 4,89 Z= -7,728 + 4,89 Z= -2,838 Sehingga besar Z = -2,838 dengan e adalah bilangan natural dengan nilai 2,718, maka

 p= E (Y=1I X )=

 p= E (Y=1IX )=

10

 p= E (Y=1IX )=

 p= E (Y=1IX )= dengan kata lain bahwa orang tersebut memiliki peluang sebesar 5,5% atau 6 % untuk terjadi kanker paru-paru, dengan kondisi ia tidak perokok dan berumur 30 tahun.

11

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF