March 27, 2017 | Author: Akbar Suwardi | Category: N/A
Download MODUL STATA - LPM, Logit Dan Probit Model (2011)...
LABORATORIUM KOMPUTASI DEPARTEMEN ILMU EKONOMI FAKULTAS EKONOMI UNIVERSITAS INDONESIA
MODUL
STATA: LPM, LOGIT, dan PROBIT MODEL (Edisi:2011) Oleh : Akbar Suwardi
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Departemen Ilmu Ekonomi-FEUI Lt. 1, Depok Telp. (021) 78886252
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
LPM, Logit, dan Probit Model PENGANTAR TEORI Model dengan variabel dependen yang bersifat diskrit, maka estimasi dengan menggunakan regresi liner akan terasa dipaksakan, karena estimator yang dihasilkan tidak lagi bersifat BLUE (Best Linier Unbiased Estimator). Hal ini disebabkan: varian error-nya tidak terdistribusi normal, estimator tidak efisien akibat heteroskedastis, dan R² tidak dapat digunakan sebagai pengukur Goodness of Fit. Oleh karenanya, untuk menghasilkan estimator persamaan yang BLUE, penelitian ini menggunakan qualitative response regression model. Terdapat tiga pendekatan untuk mengembangkan model yang menjelaskan model regresi binary response yaitu: a. Linear Probability Model (LPM) b. Logit Model c. Probit Model (Normit Model) I.
Linear Probability Model (LPM)
Linear Probability Model (LPM) merupakan metode regresi yang umum digunakan sebelum logit dan probit model dikembangkan. LPM bekerja dengan dasar bahwa variabel respon Y, yang merupakan probabilita terjadinya sesuatu, mengikuti Bernoulli probability distribution dimana: Yi 1 0 Total
[email protected]
Probability 1-Pi Pi 1
STATA – LPM, Logit, dan Probit Model | 1
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
Sumber: wcr.sonoma.edu
Gambar diatas menunjukkan bahwa garis dari Linear Probability Model (LPM) sangat minim menjelaskan atau mempresentasikan dari variabel dependent yang diskrit. Oleh karena itu, karena LPM bekerja berdasarkan metode OLS biasa maka timbul permasalahan yang telah diungkapkan sebelumnya: non-normality of the disturbance, heteroscedastis, tidak terpenuhinya ekspektasi nilai Y antara satu sampai dengan nol, dan tidak dapat digunakannya R² sebagai pengukur Goodness of Fit. Kebutuhan akan model probabilita yang menghasilkan Y yang terletak antara interval satu sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear menyebabkan logit model dikembangkan.
II.
LOGIT MODEL
Model Linear Probability Model memiliki masalah, tidak dapatnya memberikan hasil nilai Y yang terletak pada interval 1 dan 0, padahal niai probabilitas mengharuskan
kisaran
nilainya
diantara
1
dan
0.
dikarenakan
mereka
menggunakan OLS atau regresi linear dalam melakukan estimasinya, atau dengan persamaan sebagai berikut: Pr(xi)= β0 + β1xi + εi
[email protected]
STATA – LPM, Logit, dan Probit Model | 2
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
Dikarenakan persamaan regresi linear tidak dapat memenuhi persyaratan nilai probabilitas tersebut, di buatlah model logit yang menggunakan persamaan eksponensial untuk mendapatkan nilai probabilitas pada interval 1 dan 0, Dimana persamaan model Logit menjadi seperti berikut:
𝐏𝐏𝐏𝐏(𝒙𝒙) =
𝟏𝟏 𝟏𝟏 = 𝟏𝟏 + 𝐞𝐞−𝐳𝐳 𝟏𝟏 + 𝐞𝐞−(𝛂𝛂+𝛃𝛃𝐱𝐱𝐱𝐱+𝛆𝛆)
Lalu persamaan tersebut disederhanakan menjadi:
Pi =
eZ 1 = 1+ eZ 1 + e −Zi
Dimana Zi = β1 + β2Xi. Persamaan diatas lebih dikenal sebagai logistic distribution function. Persyaratan yang diminta sebelumnya, yaitu model probabilita yang menghasilkan Y antara interval satu sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear, dapat terpenuhi. Hal ini disebabkan, saat Z berkisar antara -∞ sampai dengan ∞, Pi berkisar antara 0 dan 1 sehingga Pi tidak berhubungan linear dengan Z. Meskipun begitu masih terdapat masalah estimasi karena P tidak hanya tidak linier pada X tetapi juga ke β. Namun, seperti dapat ditunjukkan pada persamaan berikut, masalah estimasi tersebut dapat diatasi. Setelah itu kita perlu menentukan
persamaan kejadian gagal, dengan merujuk
kepada Bernoulli probability distribution. Maka kita akan mendapatkan persamaan seperti dibawah ini: 𝟏𝟏 − 𝐏𝐏𝐏𝐏(𝒙𝒙) = 𝟏𝟏 −
[email protected]
𝐞𝐞𝐳𝐳 𝟏𝟏 = 𝐳𝐳 𝐞𝐞 + 𝟏𝟏 𝟏𝟏 + 𝐞𝐞𝐳𝐳
STATA – LPM, Logit, dan Probit Model | 3
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
Setelah kita memiliki persamaan kejadian sukses dan persamaan kejadian gagal, maka kita dapat pula membuat Odds Ratio yang merupakan peluang sukses dibagi dengan peluang gagal, dengan rumus matematika seperti dibawah. 𝐞𝐞𝐳𝐳 𝐳𝐳 𝐏𝐏𝐏𝐏(𝒙𝒙) = 𝐞𝐞 + 𝟏𝟏 = 𝐞𝐞𝐳𝐳 𝟏𝟏 𝟏𝟏 − 𝐏𝐏𝐏𝐏(𝒙𝒙) 𝟏𝟏 + 𝐞𝐞𝐳𝐳
Untuk mendapatkan nilai z yang sudah linier maka kita perlu melakukan treatment tambahan setelah melakukan odd ratio dimana dengan mengalikan persamaan diatas dengan Logaritma Natural dengan tujuan membuat persamaan menjadi linear, sehingga bentuk persamaan akan menjadi seperti dibawah ini: 𝐏𝐏𝐏𝐏(𝒙𝒙) � = 𝐳𝐳 = 𝛂𝛂 + 𝛃𝛃𝐱𝐱𝐱𝐱 + 𝛆𝛆 l𝐧𝐧 � 𝟏𝟏 − 𝐏𝐏𝐏𝐏(𝒙𝒙) Logaritma Natural atau ln dari odds ratio tidak hanya bersifat linear pada X tetapi juga bersifat linear terhadap parameter. Persamaan tersebut yang kemudian dikenal sebagai model logit. Kelebihan dari model logit tersebut adalah: •
Saat P berpindah dari 0 ke 1, logit L akan berpindah dari -∞ ke ∞.Oleh karena itu, meskipun probabilita terletak antara 0 hingga 1, logit sendiri tidak terbatasi. Dan meski L linear terhadap X, probabilitanya sendiri tidak.
•
L (logit) yang bernilai positif menandakan bahwa meningkatnya nilai regresor akan menyebabkan meningkatnya odds dari regresan yang setara dengan 1. Sebaliknya, L (logit) yang bernilai negative menandakan bahwa menurunnya odds dari regresan yang setara dengan 1akan menyebabkan meningkatnya nilai dari X.
•
Model logit yang diberikan pada persamaan lima dapat diinterpretasikan sebagai berikut: slope β2 merupakan pengukur perubahan nilai L karena
[email protected]
STATA – LPM, Logit, dan Probit Model | 4
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 perubahan nilai X, sementara Intercept β1 merupakan nilai dari log-odds apabila nilai suatu slope nol. Logit model juga mengasumsikan bahwa log sebuah odds ratio berhubungan linier terhadap Xi atau nilai sebuah slope.
Sumber: www.graphpad.com
Pengolahan Logit •
Untuk
menguji
signifikansi
suatu
koefisien
secara
statistik,
kita
menggunakan Z statistik (distribusi normal). •
Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2.
•
Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik. LR statistik mengikuti ditribusi
χ2
dengan derajat kebebasan (degree
of freedom) sama dengan jumlah variabel bebas •
Mencari Odds Ratio dari setiap variabel independent
•
Margina Effek dari setiap variabel independent
•
Mencari
probabilitas
setiap
variabel
independent
terhadap
variabel
dependentnya
[email protected]
STATA – LPM, Logit, dan Probit Model | 5
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 III.
Probit Model (Normit Model)
Model probit adalah salah satu model dari cummulative distribution function (CDF), yaitu model statistik yang sering digunakan untuk data dengan distribusi binomial. Model ini digunakan untuk menganalisis model dengan variabel dependen yang memiliki hasil binary—yaitu y = 1 untuk menandakan suksesnya sebuah kejadian, dan y = 0 untuk menandakan gagalnya sebuah kejadian. Terdapat beberapa asumsi yang mengikuti model probit, pertama, kita berasumsi bahwa peluang kejadian sukses satu kejadian bergantung kepada latent variabel atau yang tidak dapat di observasi, dimana akan ditentukan oleh variabel penjelas. Jika nilai dari variabel yang tidak terobservasi semakin besar, maka peluang kejadian sukses akan semakin besar. Kedua, kita berasumsi bahwa terdapat nilai kritikal dari variabel yang tidak teramati, seperti jika variabel yang tidak teramati melewati tingkat kritikalnya, maka kejadian akan sukses, atau sebaliknya. Nilai kritikal tidak teramati sama dengan variabel yang tidak teramati tersebut, tapi kita berasumsi bahwa nilai kritikal tersebut terdistribusi secara normal, dengan niai mean dan varians yang sama, dan sangat dimungkinkan bahwa tidak hanya digunakan untuk estimasi parameter variabel penjelas,
tapi juga mendapatkan
informasi mengenai variabel yang tidak teramati tersebut. Dengan asumsi normalitas, probabilitas dari nilai kritikal kurang dari atau sama dengan variabel yang tidak teramati dapat dihitung melalui cumulative distributio function. Sebagai contoh, jika keputusan keluarga memiliki ruah sendiri tergantung dengan nilai utility index Ii variabel yang tidak teramati. Sementara indeks utilitas sendiri ditentukan oleh pendapatan keluarga xi Ii = β1 + β2 Xi
[email protected]
STATA – LPM, Logit, dan Probit Model | 6
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Jika nilai kritikal Ii* lebih rendah atau sama dengan indeks utiitas Ii, keluarga akan memiliki rumah, atau sebaliknya. Probabilitas Ii* ≤ I
i
dapat dihitung dari
standardize normal CDF: Pi = P (Y = 1| X) = P (Ii* ≤ Ii) = P (Zi ≤ β1 + β2 Xi) = F (β1 + β2 Xi) Dimana P (Y = 1| X) artinya probabilitas kejadian terjadi pada nilai X yang tetap dan dimana Zi adalah variabel standar normal. F adalah standar normal CDF. Model matematis Probit sebagai berikut:
1 2π
F ( Ii ) = F ( Ii ) =
1 2π
∫
∫
Ii
−∞
e − z / 2 dz
β 1+ β 2 Xi
−∞
2
e − z / 2 dz 2
P adalah peluang kejadian sukses, maka nilai standar normal adalah diantara -∞ dan Ii, Indeks utilitas, sama seperti persamaan (β1 dan β2), kita melakukan inverse dari CDF normal. Ii = F-1 (Ii) = F-1 (Pi) = β1 + β2 Xi Dari persamaan diatas kita dapat mengestimasi parameter variabel penjelas dan variabel yang tidak teramati. Pengolahan Probit •
Untuk
menguji
signifikansi
suatu
koefisien
secara
statistik,
kita
menggunakan Z statistik (distribusi normal). •
Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan R2, untuk mengukur goodness of fit. Program Stata secara otomatis
[email protected]
STATA – LPM, Logit, dan Probit Model | 7
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 menyediakan pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2. •
Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik. LR statistik mengikuti ditribusi
χ2
dengan derajat kebebasan (degree
of freedom) sama dengan jumlah variabel bebas •
Margina Effek dari setiap variabel independent
•
Mencari
probabilitas
setiap
variabel
independent
terhadap
variabel
dependentnya •
Sensitivity; yang menyatakan seberapa besar hasil observasi positif secara tepat dinyatakan positif.
•
Specitivity; yang menyatakan seberapa besar hasil observasi negatif secara tepat dinyatakan negatif.
•
Meninjau grafik antar sensitivity/specitivity dan probability cut-off; jika koordinat (x < 0,5, y > 0,5) maka dapat dinyatakan bahwa model tersebut semakin baik dan stabil.
Sumber: teaching.sociology.ul.ie
Pada dasarnya perbedaan logit dan probit adalah Jika Logit – Cumulative standard logistic distribution (F), sedangkan Probit – Cumulative standard normal distribution (Φ). Namun Pada akhirnya dari dua model tersebut memiliki hasil yang persis sama.(Oscar Torres, Princeton University)
[email protected]
STATA – LPM, Logit, dan Probit Model | 8
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
APLIKASI PADA STATA Pada contoh aplikasi ini yang kita gunakan adalah data mroz.dta, untuk mengetahui data kita tersebut seperti apa maka kita perlu mengenal data itu tersebut. •
Mengenal data o Untuk mengetahui jenis data, variabel name, value label, format serta varabel label kita dapat melakukannya sebagai berikut: describe
Contains data from D:\Kelas Ekonomet2\lab1- Logit n Probit\mroz.dta obs: 753 vars: 22 2 Sep 1996 16:04 size: 39,909 (99.6% of memory free) ----------------------------------------------------------------------------storage display value variable name type format label variable label ----------------------------------------------------------------------------inlf byte %9.0g =1 if in lab frce, 1975 hours int %9.0g hours worked, 1975 kidslt6 byte %9.0g # kids < 6 years kidsge6 byte %9.0g # kids 6-18 age byte %9.0g woman's age in yrs educ byte %9.0g years of schooling wage float %9.0g est. wage from earn, hrs repwage float %9.0g rep. wage at interview in 1976 hushrs int %9.0g hours worked by husband, 1975 husage byte %9.0g husband's age huseduc byte %9.0g husband's years of schooling huswage float %9.0g husband's hourly wage, 1975 faminc float %9.0g family income, 1975 mtr float %9.0g fed. marg. tax rte facing woman motheduc byte %9.0g mother's years of schooling fatheduc byte %9.0g father's years of schooling unem float %9.0g unem. rate in county of resid. city byte %9.0g =1 if live in SMSA exper byte %9.0g actual labor mkt exper nwifeinc float %9.0g (faminc - wage*hours)/1000 lwage float %9.0g log(wage) expersq int %9.0g exper^2 -------------------------------------------------------------------
[email protected]
STATA – LPM, Logit, dan Probit Model | 9
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
o Untuk mengetahui berapa jumlah observasi, mean, std.deviasi, nilai max dan nilai minimum kita dapat melakukannya sebagai berikut: sum
Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------inlf | 753 .5683931 .4956295 0 1 hours | 753 740.5764 871.3142 0 4950 kidslt6 | 753 .2377158 .523959 0 3 kidsge6 | 753 1.353254 1.319874 0 8 age | 753 42.53785 8.072574 30 60 -------------+-------------------------------------------------------educ | 753 12.28685 2.280246 5 17 wage | 753 2.374565 3.241829 0 25 repwage | 753 1.849734 2.419887 0 9.98 hushrs | 753 2267.271 595.5666 175 5010 husage | 753 45.12085 8.058793 30 60 -------------+-------------------------------------------------------huseduc | 753 12.49137 3.020804 3 17 huswage | 753 7.482179 4.230559 .4121 40.509 faminc | 753 23080.59 12190.2 1500 96000 mtr | 753 .6788632 .0834955 .4415 .9415 motheduc | 753 9.250996 3.367468 0 17 -------------+-------------------------------------------------------fatheduc | 753 8.808765 3.57229 0 17 unem | 753 8.623506 3.114934 3 14 city | 753 .6427623 .4795042 0 1 exper | 753 10.63081 8.06913 0 45 nwifeinc | 753 20.12896 11.6348 -.0290575 96 -------------+-------------------------------------------------------lwage | 428 1.190173 .7231978 -2.054164 3.218876 expersq | 753 178.0385 249.6308 0 2025
o Untuk mengetahui suatu komposisi nilai dari suatu nilai dummy, kita dapat melakukannya sebagai berikut: (misal variabel yang kita ingin tahu adalah inlf)
inspect inlf
[email protected]
STATA – LPM, Logit, dan Probit Model | 10
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 inlf: =1 if in lab frce, 1975 -----------------------------| # | # | # # | # # | # # | # # +---------------------0 1 (2 unique values)
Number of Observations -----------------------------Total Integers Nonintegers 325 325 428 428 ------------753 753 ----753
Negative Zero Positive Total Missing
o Untuk membuat lebih mudah dalam simulasi model logit dan probit didalam modul ini, kita akan membuat variabel baru yaitu variabel individu awal. Dengan cara:
gen idawal = _n •
Model yang digunakan Setelah kita mengetahui jenis data kita serta mengetahui berapa jumlah observasi, mean, std.deviasi, nilai max dan nilai minimum, maka kita masuk kedalam model yang ingin kita gunakan. Contoh model pada modul untuk data ini adalah
P (infl = 1) = α + β1kidsge6 + β 2 kidslt6 + β 3age + β 4educ + β 5nwifeinc + β 6 exper + ε Keterangan: inlf adalah =1 if in lab force in 1975, kidsge6 adalah number of kids aged 6-18 kidslt6 adalah number of kids aged < 6 years age adalah woman's age in years educ adalah years of schooling nwifeinc adalah (faminc - wage*hours)/1000 exper adalah actual labor market experience
[email protected]
STATA – LPM, Logit, dan Probit Model | 11
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 1. LPM
reg
inlf kidslt6 kidsge6 age educ nwifeinc exper
Source | SS df MS -------------+-----------------------------Model | 46.9082358 6 7.8180393 Residual | 137.81952 746 .184744665 -------------+-----------------------------Total | 184.727756 752 .245648611
Number of obs F( 6, 746) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
753 42.32 0.0000 0.2539 0.2479 .42982
-----------------------------------------------------------------------------inlf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -.2718291 .0335715 -8.10 0.000 -.3377348 -.2059233 kidsge6 | .0125301 .0132781 0.94 0.346 -.0135368 .038597 age | -.017712 .0024487 -7.23 0.000 -.0225191 -.0129049 educ | .0398189 .0074006 5.38 0.000 .0252905 .0543474 nwifeinc | -.0033265 .0014574 -2.28 0.023 -.0061876 -.0004654 exper | .0225725 .0021786 10.36 0.000 .0182956 .0268493 _cons | .7072318 .1504335 4.70 0.000 .4119083 1.002555 ------------------------------------------------------------------------------
Karena kita melakukan data menggunakan LPM dimana berdasarkan OLS, maka dari hasil diatas kita dapat membuat model menjadi seperti berikut: (yaitu dengan memasukan koefisient ke model awal)
P(infl = 1) = 0.707 − 0.271 kidslt6 + 0.013 kidsge6 − 0.017 age + 0.039 educ − 0.003 nwifeinc + 0.023 exper •
Melihat nilai prediksi dan error dari estimasi menggunakan LPM
reg inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) predict lpminlfhat (untuk mendapatkan nilai inlf estimasi) predict erlpm, resid (untuk mendapatkan nilai error dari inlf estimasi (lpminlfhat))
list inlf lpminlfhat erlpm in 26/35
[email protected]
STATA – LPM, Logit, dan Probit Model | 12
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Nilai Prediksi dengan LPM
26. 27. 28. 29. 30. 31. 32. 33. 34. 35.
+-----------------------------+ | inlf lpminl~t erlpm | |-----------------------------| | 1 1.030639 -.030639 | | 1 .7865728 .2134272 | | 1 .8024666 .1975335 | | 1 .6710289 .3289711 | | 1 .5469357 .4530643 | |-----------------------------| | 1 .9649304 .0350696 | | 1 .4919043 .5080957 | | 1 .9282249 .0717751 | | 1 .5534077 .4465922 | | 1 1.138675 -.1386752 | +-----------------------------+
list
481. 482. 483. 484. 485.
inlf lpminlfhat erlpm in 481/485
+------------------------------+ | inlf lpminl~t perlpm | |------------------------------| | 0 .4951564 -.4951564 | | 0 .5932751 -.5932751 | | 0 .065651 -.065651 | | 0 -.3042662 .3042662 | | 0 .0083976 -.0083976 | +------------------------------+
Contoh, jika kita punya data pada list 26, dengan nilai setiap variabel, dapat dilihat dengan cara berikut:
List
inlf
kidslt6
kidsge6
age
educ
nwifeinc
exper
lpminlfhat erlpm in 26 Nilai Prediksi dengan LPM
+--------------------------------------------------------------------------------+ | inlf kidslt6 kidsge6 age educ nwifeinc exper lpminl~t erlpm | |--------------------------------------------------------------------------------| 26. | 1 0 2 43 17 27.34999 21 1.030639 -.030639 | +--------------------------------------------------------------------------------+
[email protected]
STATA – LPM, Logit, dan Probit Model | 13
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Dimana dari nilai variabel tersebut kita masukin kedalam model LPM yang telah kita dapatkan koefisienya dari hasil estimasi di atas. Terlihat bahwa estimasi yang kita peroleh bisa lebih dari 1, padahal data sebenarnya data kita hanya antara 0 dan 1. Oleh karena itu, permasalahan tersebut merupakan salah satu kelemahan dari LPM.
•
Grafik scatterplot
Untuk memperjelas hasil dari estimasi menggunakan LPM (lpminlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut: 1. Membuat Scatter Plot berdasarkan Fitted Values inlf lpminlfhat || lfit inlf lpminlfhat
-.5
0
.5
1
1.5
scatter
-.5
0
.5 Fitted values
=1 if in lab frce, 1975
1
1.5
Fitted values
2. Membuat Scatter Plot berdasarkan nilai Estimasi menggunakan LPM sort
lpminlfhat
gen idlpmm = _n scatter
[email protected]
lpminlfhat inlf
idlpmm
STATA – LPM, Logit, dan Probit Model | 14
-.5
0
.5
1
1.5
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
0
600
400 idlpmm
200 Fitted values
800
=1 if in lab frce, 1975
Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Fitted Values dan
estimasi menggunakan LPM (lpminlfhat) keluar dari nilai inlf
aslinya, yaitu antara 0 dan 1. 3. Membuat Scatter Plot nilai predicted ( yˆ ) berdasarkan nilai residual ( uˆ ) dari nilai Estimasi menggunakan LPM akan terlihat seperti berikut:
-1
-.5
Residuals 0
.5
1
rvfplot
-.5
0
.5
1
Fitted values
Karena uˆ = y − yˆ , maka uˆ = − yˆ
ketika
above graph yaitu -1), sedangkan uˆ = 1 − yˆ
y = 0 (the lower line in the
ketika
y =1
(the upper
line).
[email protected]
STATA – LPM, Logit, dan Probit Model | 15
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 2. LOGIT logit inlf kidslt6 kidsge6 age educ nwifeinc exper
Iteration Iteration Iteration Iteration Iteration
0: 1: 2: 3: 4:
log log log log log
likelihood likelihood likelihood likelihood likelihood
= = = = =
-514.8732 -406.91038 -406.14404 -406.14318 -406.14318
Logistic regression
Number of obs LR chi2(6) Prob > chi2 Pseudo R2
Log likelihood = -406.14318
= = = =
753 217.46 0.0000 0.2112
-----------------------------------------------------------------------------inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -1.439393 .2014989 -7.14 0.000 -1.834324 -1.044462 kidsge6 | .0581735 .07338 0.79 0.428 -.0856487 .2019957 age | -.0910884 .0143207 -6.36 0.000 -.1191564 -.0630204 educ | .2269766 .0432954 5.24 0.000 .1421191 .3118341 nwifeinc | -.0202165 .0082637 -2.45 0.014 -.036413 -.0040199 exper | .1197458 .0136264 8.79 0.000 .0930385 .146453 _cons | .8379088 .8409368 1.00 0.319 -.810297 2.486115 ------------------------------------------------------------------------------
Dari hasil regress kita menggunakan logit maka kita mendapatkan koefisient untuk dimasukan kedalam rumus logistik,
Pi =
eZ 1 = 1+ eZ 1 + e −Zi
menjadi seperti berikut:
𝐏𝐏𝐏𝐏(𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒊 = 𝟏𝟏) 𝐞𝐞𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖−𝟏𝟏.𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝐜𝐜−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏 = 𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖−𝟏𝟏.𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏 𝐞𝐞 + 𝟏𝟏
Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat berapa nilai probabilitas prediksi dengan logit, maka dapat dilakukan dengan seperti berikut:
[email protected]
STATA – LPM, Logit, dan Probit Model | 16
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
logit inlf kidslt6 kidsge6 age educ nwifeinc exper predict plgtinlfht (untuk mendapatkan nilai probabilitas inlf estimasi) Sebelum kita ingin melihat nilai dari list, kita harus membuat urutan dalam data seperti semua, dengan cara:
sort idawal list inlf kidslt6 kidsge6 age educ nwifeinc exper plgtinlfht in 1
Nilai Probabilitas inlf=1 dengan Logit
+---------------------------------------------------------------------+ | inlf kidslt6 kidsge6 age educ nwifeinc exper plgiti~t| |---------------------------------------------------------------------| 1. | 1 1 0 32 12 10.91006 14 .6599977 | +---------------------------------------------------------------------+
Dengan memasukan rumus yang telah memiliki keofisien kita akan mendapatkan nilai inlf estimasi (plgtinlfht), atau nilai Probabilitas prediksi dengan rumus seperti ini:
𝐏𝐏𝐏𝐏(𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒊 = 𝟏𝟏)
𝐞𝐞𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖−𝟏𝟏.𝟒𝟒𝟒𝟒𝟒𝟒(𝟏𝟏)+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟎𝟎)−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟑𝟑𝟑𝟑)+𝟎𝟎.𝟐𝟐𝟐𝟐𝟐𝟐(𝟏𝟏𝟏𝟏)−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟏𝟏𝟏𝟏.𝟗𝟗𝟗𝟗)+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏(𝟏𝟏𝟏𝟏) = 𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖−𝟏𝟏.𝟒𝟒𝟒𝟒𝟒𝟒(𝟏𝟏)+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟎𝟎)−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟑𝟑𝟑𝟑)+𝟎𝟎.𝟐𝟐𝟐𝟐𝟐𝟐(𝟏𝟏𝟏𝟏)−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎(𝟏𝟏𝟏𝟏.𝟗𝟗𝟗𝟗)+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏(𝟏𝟏𝟏𝟏) 𝐞𝐞 + 𝟏𝟏 = 𝟎𝟎. 𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔𝟔
[email protected]
Nilai Probabilitas inlf=1 dengan Logit
STATA – LPM, Logit, dan Probit Model | 17
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 •
Lihat odds ratio logit inlf kidslt6 kidsge6 age educ nwifeinc exper, or
Iteration Iteration Iteration Iteration Iteration
0: 1: 2: 3: 4:
log log log log log
likelihood likelihood likelihood likelihood likelihood
= = = = =
-514.8732 -406.91038 -406.14404 -406.14318 -406.14318
Logistic regression
Number of obs LR chi2(6) Prob > chi2 Pseudo R2
Log likelihood = -406.14318
= = = =
753 217.46 0.0000 0.2112
-----------------------------------------------------------------------------inlf | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | .2370717 .0477697 -7.14 0.000 .1597215 .351881 kidsge6 | 1.059899 .0777754 0.79 0.428 .9179166 1.223843 age | .912937 .0130739 -6.36 0.000 .8876689 .9389243 educ | 1.254801 .0543271 5.24 0.000 1.152714 1.365928 nwifeinc | .9799865 .0080983 -2.45 0.014 .964242 .9959881 exper | 1.12721 .0153598 8.79 0.000 1.097504 1.157721 ------------------------------------------------------------------------------
Nilai Odds Ratio mewakili kemungkinan untuk inlf = 1 ketika variabel meningkat sebesar 1 unit. Nilai ini adalah exp (logit coeff). Jika > ATAU 1 maka kemungkinan inlf = 1 meningkat. Jika < ATAU 1 maka kemungkinan inlf = 1 menurun. Lihatlah tanda koefisien logit
•
Melihat Odds ratio pada different levels di setiap variable logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) exp
-------------------------------------------------------------------------Dependent variable: inlf
Equation: inlf
Command: logit
Variables left as is: kidsge6, age, educ, exper, nwifeinc --------------------------------------------------------------------------
---------------------# kids <
|
[email protected]
STATA – LPM, Logit, dan Probit Model | 18
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 6 years
|
exp(xb)
----------+----------0 |
1.85037
1 |
.589443
2 |
.289553
3 |
.023302
----------------------
Key:
exp(xb)
=
exp(xb)
Penjelasannya: ketika kidschi2) lebih besar dari α atau terima H0. Dimana memilki hipotesisi seperti berikut: H0 : 𝑦𝑦 = 𝑦𝑦� ∶ Tidak Tolak Model
[email protected]
STATA – LPM, Logit, dan Probit Model | 22
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 H1 : 𝑦𝑦 ≠ 𝑦𝑦� ∶ Tolak Model •
Pengujian Sensitivity dan Specitivity
Pada pengujian ini prinsipnya sama dengan uji goodness of fit sebagai bentuk perwakilan pengganti R2, dengan melihat melalui specitivity & sensitivity. Dengan cara: logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat classification Logistic model for inlf -------- True -------Classified | D ~D | Total -----------+--------------------------+----------+ | 347 113 | 460 | 81 212 | 293 -----------+--------------------------+----------Total | 428 325 | 753 Classified + if predicted Pr(D) >= .5 True D defined as inlf != 0 -------------------------------------------------Sensitivity Pr( +| D) 81.07% Specificity Pr( -|~D) 65.23% Positive predictive value Pr( D| +) 75.43% Negative predictive value Pr(~D| -) 72.35% -------------------------------------------------False + rate for true ~D Pr( +|~D) 34.77% False - rate for true D Pr( -| D) 18.93% False + rate for classified + Pr(~D| +) 24.57% False - rate for classified Pr( D| -) 27.65% -------------------------------------------------Correctly classified 74.24% --------------------------------------------------
Berdasarkan hasil diatas dapat disimpulkan: o Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar sebesar 65.23%% o Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar sebesar 81.07% o Secara Overall : model mampu menyatakan secara benar sebesar 74.24%
[email protected]
STATA – LPM, Logit, dan Probit Model | 23
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 •
Grafik scatterplot
Untuk memperjelas hasil dari estimasi menggunakan Logit (logitinlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut: 1. Membuat grafik Scatter Plot Transformasi logit Kita harus membuat variable baru, yaitu berisi ln dari (probabilitas/(1probabilitas)), seperti yang tertera dalam grafik dalam membuat kurva transformasi logit. Dengan cara:
gen lnplgtinlfht = ln( plgtinlfht/(1- plgtinlfht)) plgtinlfht inlf lnplgtinlfht
0
.2
.4
.6
.8
1
scatter
-4
-2
0 lnplgtinlfht
Pr(inlf)
2. Membuat
Scatter
Plot
2
4
=1 if in lab frce, 1975
berdasarkan
nilai
Probabilitas
Estimasi
menggunakan Logit, dengan cara:
sort
plgtinlfht
gen idlogit = _n scatter
[email protected]
plgtinlfht inlf
idlogit
STATA – LPM, Logit, dan Probit Model | 24
0
.2
.4
.6
.8
1
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
0
400 idlogit
200 Pr(inlf)
600
800
=1 if in lab frce, 1975
Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Transformasi logit dan Probabilitas Estimasi menggunakan Logit (plgtinlfht) tidak keluar dari nilai inlf aslinya, yaitu antara 0 dan 1. Berbeda dengan hasil dari LPM.
[email protected]
STATA – LPM, Logit, dan Probit Model | 25
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 3. PROBIT probit
Iteration Iteration Iteration Iteration Iteration
0: 1: 2: 3: 4:
inlf kidslt6 kidsge6 age educ nwifeinc exper
log log log log log
likelihood likelihood likelihood likelihood likelihood
= = = = =
-514.8732 -407.11545 -406.21971 -406.21886 -406.21886
Probit regression
Number of obs LR chi2(6) Prob > chi2 Pseudo R2
Log likelihood = -406.21886
= = = =
753 217.31 0.0000 0.2110
-----------------------------------------------------------------------------inlf | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------kidslt6 | -.8742923 .1175098 -7.44 0.000 -1.104607 -.6439773 kidsge6 | .0345459 .0429862 0.80 0.422 -.0497055 .1187974 age | -.0555548 .0083447 -6.66 0.000 -.0719101 -.0391995 educ | .1336902 .0251346 5.32 0.000 .0844273 .1829531 nwifeinc | -.0115648 .0047942 -2.41 0.016 -.0209613 -.0021684 exper | .0702165 .007571 9.27 0.000 .0553775 .0850555 _cons | .5795817 .496205 1.17 0.243 -.3929623 1.552126 ------------------------------------------------------------------------------
Dari hasil regress kita menggunakan Probit maka kita mendapatkan koefisient untuk dimasukan kedalam rumus Probabiltas (probit) berikut: menjadi seperti berikut: 𝑭𝑭 (𝑰𝑰𝒊𝒊 ) = 𝑭𝑭 (𝑰𝑰𝒊𝒊 ) =
𝟏𝟏
√𝟐𝟐𝟐𝟐
𝟏𝟏
√𝟐𝟐𝟐𝟐
�
𝑰𝑰𝒊𝒊
� 𝒆𝒆−𝒛𝒛 −∞
𝜷𝜷𝟏𝟏 +𝜷𝜷𝟐𝟐 𝑿𝑿𝒊𝒊
−∞
𝟐𝟐 /𝟐𝟐
𝒆𝒆−𝒛𝒛
𝒅𝒅𝒅𝒅
𝟐𝟐 /𝟐𝟐
𝒅𝒅𝒅𝒅
Pi = P (Y = 1| X) = P (Ii* ≤ Ii) = P (Zi ≤ β1 + β2 Xi) = F (β1 + β2 Xi)
menjadi seperti berikut:
𝑭𝑭 (𝑰𝑰𝒊𝒊 ) =
𝟏𝟏
√𝟐𝟐𝟐𝟐
(𝟎𝟎.𝟓𝟓𝟓𝟓𝟓𝟓−𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎 )
�
−∞
[email protected]
𝒆𝒆−𝒛𝒛
𝟐𝟐 /𝟐𝟐
𝒅𝒅𝒅𝒅
STATA – LPM, Logit, dan Probit Model | 26
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
𝐏𝐏𝐢𝐢 = 𝐅𝐅 (𝛃𝛃𝟏𝟏 + 𝛃𝛃𝟐𝟐 𝐗𝐗𝐢𝐢)
= 𝐅𝐅 (𝟎𝟎. 𝟓𝟓𝟓𝟓𝟓𝟓 − 𝟎𝟎. 𝟖𝟖𝟖𝟖𝟖𝟖𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤 + 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎 − 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎 + 𝟎𝟎. 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏 − 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎 + 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎)
Contoh, misalkan kita ingin melihat data kita pada baris satu dari stata dan melihat berapa Nilai Probabilitas Prediksi dengan probit, maka dapat dilakukan dengan seperti berikut:
probit inlf kidslt6 kidsge6 age educ nwifeinc exper predict prinlfhat (untuk mendapatkan nilai probabilitas inlf estimasi) Sebelum kita ingin melihat nilai dari list, kita harus membuat urutan dalam data seperti semua, dengan cara:
sort idawal list inlf kidslt6 kidsge6 age educ nwifeinc exper prinlfhat in 1 Nilai Probabilitas inlf=1 dengan Probit
+---------------------------------------------------------------------+ | inlf
kidslt6
kidsge6
age
educ
nwifeinc
exper
prinl~t |
|---------------------------------------------------------------------| 1. |
1
1
0
32
12
10.91006
14
.6512424 |
+---------------------------------------------------------------------+
Dengan memasukan nilai-nilai diatas kedalam rumus yang telah memiliki keofisien, kita akan mendapatkan nilai inlf estimasi (proinlfhat) atau nilai Probabilitas prediksi dengan proses seperti berikut :
[email protected]
STATA – LPM, Logit, dan Probit Model | 27
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
𝑭𝑭 (𝑰𝑰𝒊𝒊 ) =
𝟏𝟏
√𝟐𝟐𝟐𝟐
(𝟎𝟎.𝟓𝟓𝟓𝟓𝟓𝟓−𝟎𝟎.𝟖𝟖𝟖𝟖𝟖𝟖𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤𝐤+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏−𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎+𝟎𝟎.𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎 )
�
−∞
𝒆𝒆−𝒛𝒛
𝟐𝟐 /𝟐𝟐
𝒅𝒅𝒅𝒅
𝐏𝐏𝐢𝐢 = 𝐅𝐅 (𝛃𝛃𝟏𝟏 + 𝛃𝛃𝟐𝟐 𝐗𝐗𝐢𝐢)
= 𝐅𝐅 (𝟎𝟎. 𝟓𝟓𝟓𝟓𝟓𝟓 − 𝟎𝟎. 𝟖𝟖𝟖𝟖𝟖𝟖(𝟏𝟏) + 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎(𝟎𝟎) − 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎(𝟑𝟑𝟑𝟑) + 𝟎𝟎. 𝟏𝟏𝟏𝟏𝟏𝟏(𝟏𝟏𝟏𝟏) − 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎(𝟏𝟏𝟏𝟏. 𝟗𝟗𝟗𝟗𝟗𝟗𝟗𝟗𝟗𝟗) + 𝟎𝟎. 𝟎𝟎𝟎𝟎𝟎𝟎(𝟏𝟏𝟏𝟏) = 0.6512424
•
Nilai Probabilitas inlf=1 dengan Probit
Melihat exp (e) ratio pada different levels di setiap variable di Model Probit logit inlf kidslt6 kidsge6 age educ nwifeinc exper (omitted) adjust, by (kidslt6) exp
-------------------------------------------------------------------------Dependent variable: inlf
Equation: inlf
Command: probit
Variables left as is: kidsge6, age, educ, exper, nwifeinc --------------------------------------------------------------------------
---------------------# kids <
|
6 years
|
exp(xb)
----------+----------0 |
1.4445
1 |
.730329
2 |
.469383
3 |
.104823
---------------------Key:
exp(xb)
=
exp(xb)
Penjelasannya: ketika kidschi2) lebih besar dari α atau terima H0. Dimana memilki hipotesis seperti berikut: H0 : 𝑦𝑦 = 𝑦𝑦� ∶ Tidak Tolak Model
•
H1 : 𝑦𝑦 ≠ 𝑦𝑦� ∶ Tolak Model
Pengujian Sensitivity dan Specitivity
Pada pengujian ini prinsipnya sama dengan uji goodness of fit sebagai bentuk perwakilan pengganti R2, dengan melihat melalui specitivity & sensitivity. Dengan cara:
probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) estat classification Probit model for inlf -------- True -------Classified | D ~D | Total -----------+--------------------------+----------+ | 348 112 | 460 | 80 213 | 293 -----------+--------------------------+----------Total | 428 325 | 753
[email protected]
STATA – LPM, Logit, dan Probit Model | 32
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 Classified + if predicted Pr(D) >= .5 True D defined as inlf != 0 -------------------------------------------------Sensitivity Pr( +| D) 81.31% Specificity Pr( -|~D) 65.54% Positive predictive value Pr( D| +) 75.65% Negative predictive value Pr(~D| -) 72.70% -------------------------------------------------False + rate for true ~D Pr( +|~D) 34.46% False - rate for true D Pr( -| D) 18.69% False + rate for classified + Pr(~D| +) 24.35% False - rate for classified Pr( D| -) 27.30% -------------------------------------------------Correctly classified 74.50% --------------------------------------------------
Berdasarkan hasil diatas dapat disimpulkan: o Specitivity : observasi hasil negative yang dinyatakan secara negative secara benar sebesar 65.54%% o Sensitivity : observasi hasil positive yang dinyatakan secara positive secara benar sebesar 81.31% o Secara Overall : model mampu menyatakan secara benar sebesar 74.50%
•
Grafik scatterplot
Untuk memperjelas hasil dari estimasi menggunakan Probit (prinlfhat) maka nilainya dapat kita gambarkan menggunakan scatter plot, dengan cara seperti berikut:: 1. Membuat grafik Scatter Plot Transformasi Probit Kita harus membuat variable baru, yaitu berisi ln dari (probabilitas/(1probabilitas)), seperti yang tertera dalam grafik dalam membuat kurva transformasi Probit, deengan cara:
gen lnprinlfhat = ln(prinlfhat/(1-prinlfhat)) scatter prinlfhat inlf lnprinlfhat
[email protected]
STATA – LPM, Logit, dan Probit Model | 33
0
.2
.4
.6
.8
1
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
-6
-4
-2
0
2
4
lnprinlfhat Pr(inlf)
2. Membuat
Scatter
Plot
=1 if in lab frce, 1975
berdasarkan
nilai
Probabilitas
Estimasi
menggunakan Probit, dengan cara:
sort
prinlfhat
gen idprobit = _n prinlfhat inlf
idprobit
0
.2
.4
.6
.8
1
scatter
0
200
400 idprobit Pr(inlf)
600
800
=1 if in lab frce, 1975
Dari hasil kedua scatter plot diatas menunjukkan bahwa nilai Transformasi probit dan
[email protected]
Probabilitas Estimasi menggunakan probit STATA – LPM, Logit, dan Probit Model | 34
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 (prinlfhat) tidak keluar dari nilai inlf aslinya, yaitu antara 0 dan 1. Berbeda dengan hasil dari LPM, namun sama dengan hasil menggunakan estimasi logit. 4. PERBANDINGAN ANTARA LOGIT DAN PROBIT DENGAN UJI FITSTAT logit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat, saving(L1) (Omitted) probit inlf kidslt6 kidsge6 age educ nwifeinc exper (Omitted) fitstat, using(L1) force Measures of Fit for probit of inlf Current Model: probit N: 753 Log-Lik Intercept Only: -514.873 Log-Lik Full Model: -406.219 D: 812.438(746) LR: 217.309(6) Prob > LR: 0.000 McFadden's R2: 0.211 McFadden's Adj R2: 0.197 Maximum Likelihood R2: 0.251 Cragg & Uhler's R2: 0.336 McKelvey and Zavoina's R2: 0.388 Efron's R2: 0.261 Variance of y*: 1.633 Variance of error: 1.000 Count R2: 0.745 Adj Count R2: 0.409 AIC: 1.098 AIC*n: 826.438 BIC: -4129.115 BIC': -177.564
Saved logit 753 -514.873 -406.143 812.286(746) 217.460(6) 0.000 0.211 0.198 0.251 0.337 0.354 0.261 5.090 3.290 0.742 0.403 1.097 826.286 -4129.266 -177.716
Difference 0 0.000 -0.076 0.151(0) -0.151(0) 0.000 -0.000 -0.000 -0.000 -0.000 0.034 -0.001 -3.457 -2.290 0.003 0.006 0.000 0.151 0.151 0.151
Difference of 0.151 in BIC' provides weak support for saved model.
[email protected]
STATA – LPM, Logit, dan Probit Model | 35
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 5. PERBANDINGAN
ANTARA
LPM.
LOGIT,
DAN
PROBIT
MENGGUNAKAN GRAFIK SCATTER PLOT •
LPM dan Logit berdasarkan hasil estimasi (estimasi probabilitas) scatter
idlpmm ||scatter
plgtinlfht
idlogit
-.5
0
.5
1
1.5
inlf
lpminlfhat inlf
0
200
400
Fitted values Pr(inlf)
•
600
800
=1 if in lab frce, 1975 =1 if in lab frce, 1975
LPM dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter
idlpmm || scatter
prinlfhat
idprobit
-.5
0
.5
1
1.5
inlf
lpminlfhat inlf
0
200 Fitted values Pr(inlf)
[email protected]
400
600
800
=1 if in lab frce, 1975 =1 if in lab frce, 1975
STATA – LPM, Logit, dan Probit Model | 36
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252 •
Logit dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter
plgtinlfht inlf idprobit
0
.2
.4
.6
.8
1
prinlfhat inlf
idlogit || scatter
0
400
200 Pr(inlf) Pr(inlf)
•
600
800
=1 if in lab frce, 1975 =1 if in lab frce, 1975
LPM, Logit dan Probit berdasarkan hasil estimasi (estimasi probabilitas) scatter
lpminlfhat inlf
plgtinlfht inlf
idlpmm || scatter
idlogit || scatter
prinlfhat inlf
-.5
0
.5
1
1.5
idprobit
0
200 Fitted values Pr(inlf) Pr(inlf)
[email protected]
400
600
800
=1 if in lab frce, 1975 =1 if in lab frce, 1975 =1 if in lab frce, 1975
STATA – LPM, Logit, dan Probit Model | 37
Lab. Komputasi Departemen Ilmu Ekonomi Gedung Dep. Ilmu Ekonomi-FEUI Lt. 1, Depok Telp.(021)78886252
•
Grafik Transformasi Logit dan Probit scatter
plgtinlfht inlf lnplgtinlfht || scatter
0
.2
.4
.6
.8
1
prinlfhat inlf lnprinlfhat
-6
-4
-2 Pr(inlf) Pr(inlf)
0
2
4
=1 if in lab frce, 1975 =1 if in lab frce, 1975
DAFTAR PUSTAKA Gujarati, Damodar. 2006. Basic Econometrics. McGraw-Hill. https://dss.princeton.edu/ https://teaching.sociology.ul.ie/ https://wcr.sonoma.edu/ https://www.ats.ucla.edu/ https://www.graphpad.com/ Manual Stata 11. 2009. Stata Press Publication, College Station, Texas “Jika ada kritik dan saran atas modul ini, silahkan email ke
[email protected] Segala kritik dan saran sangat berharga bagi penulis. ”
[email protected]
STATA – LPM, Logit, dan Probit Model | 38