Latihan STATA (Regresi Dan Uji Asumsi Klasik)
April 21, 2017 | Author: Muhammad Syah | Category: N/A
Short Description
latihan stata untuk data cross section sederhana...
Description
Latihan Regresi Linear STATA – Muhammad Firman Untuk melakukan uji regresi linear sederhana atau berganda, harus memenuhi syarat-syarat atau yang disebut dengan istilah Uji Asumsi Klasik. Kita akan menggunakan regresi linear berganda sehingga kita akan mengikutkan uji asumsi klasik untuk regresi linear berganda yaitu antara lain: 1.
normalitas residual
2.
heteroskedastisitas
3.
multikolinearitas.
Untuk uji autokorelasi ditiadakan karena model ini bukanlah model time series. Sedangkan untuk uji linearitas juga ditiadakan sebab kita sudah mengasumsikan bahwa terdapat hubungan yang linear antara masing-masing variabel independen dengan variabel dependen, yang nantinya akan ditunjukkan pada tutorial ini dalam nilai koefisien korelasi antara variabel independen dengan variabel dependen.
1.) Mengimpor data statistik
Buka aplikasi STATA (CTRL + O) atau (Klik File > Import > Excel Spreadsheet ) dan isikan data sebagai berikut
Download di : https://drive.google.com/file/d/0B9P1cIyOPkIQTWtSUENvejFKVXM/edit?usp=sharing
X1
X2
X3
Y
res
abs_res
X1
X2
X3
Y
18.5
15
22.9
9.43
.7064611
.7064611
19.8
33.7
33.5
14.03
18
28.1
26.6
11.73
1.168.247
1.168.247
5.2
30.3
34.3
10.41
8.9
26.9
31.4
9.41
-.8078965
.8078965
7.8
19.3
9.89
1.067.333
1.067.333
17.4
13.1
17.8
8.35
.6937388
.6937388
2.3
15.2
7.72
1.187.881
1.187.881
19.9
27.1
18.1
6.51
-2.878.522
2.878.522
5.9
16.8
5.55
(1.070.003)
1.070.003
16.7
24.9
15.3
6.22
-2.197.204
2.197.204
19.3
23.3
26.3
8.82
(1.340.459)
1.340.459
18.5
19.4
34.8
10.75
-.1963008
.1963008
3.3
20.7
32.7
11.34
2.138.113
2.138.113
14.9
29.5
23.5
11.23
1.306.193
1.306.193
12.5
28.9
27.4
10.87
12.5
17.3
28.8
7.59
-1.630.199
1.630.199
11.2
20.6
19.7
6.27
8.1
30
38.6
12.34
.8148431
.8148431
19.2
16.6
8.86
10.6
16
15.7
4.23
-2.709.788
2.709.788
12.6
24.1
35.5
14.44
3.516.423
3.516.423
13.2
22.5
19.5
9.09
.6523334
.6523334
19
24.4
19.4
12.56
3.346.223
3.346.223
7.8
35.2
30.7
11.67
.821672
.821672
9.4
31.4
20.5
10.21
10.6
25.5
26.5
8.91
-.6096631
.6096631
4.5
27.3
29.5
8.86
-.6628144
.6628144
15.2
30.7
35.9
8.18
-374.503
374.503
1.8
35.2
37.7
11.42
.1460714
.1460714
21.1
25
19.7
10.66
1.124.101
1.124.101
14.6
27.6
24.3
9.08
-.7380338
.7380338
21.8
22.6
30.6
12.82
1.833.014
1.833.014
20.7
32.6
33.5
10.75
8.8
21
33
12.76
2.916.732
2.916.732
2.5
26.2
24.6
7.95
-.5244462
.5244462
7.3
24.1
23
6.17
-2.345.475
2.345.475
3.8
30.2
38.3
10.25
-.808354
.808354
20.6
18.6
27.6
8.54
-1.467.802
1.467.802
10.4
26.3
25.3
8.73
-.671995
.671995
19.3
24.9
24.2
9.26
-.7509922
.7509922
5.2
14.4
20.7
7.54
.5743472
.5743472
4.4
21.3
19.5
9.04
1.630.575
1.630.575
18.2
23.8
39.6
10.54
7.4
24.8
35.5
9.25
-1.209.935
1.209.935
16.4
19.2
24.4
9.56
.3999817
.3999817
15.3
18.2
16
4.95
-2.742.946
2.742.946
8.1
22.8
22.6
8.42
.0146096
.0146096
16.8
33
23.8
13.04
2.518.385
2.518.385
22.1
21.6
7.97
18.1
13.6
36.5
10.47
-.0959156
.0959156
10.9
25.8
37.6
11.1
-.1352234
.1352234
6.1
26.1
26.3
8.46
-.6280427
.6280427
14
15.4
16.7
7.68
.3025877
.3025877
13.7
15.2
33.7
9.63
-.2293169
.2293169
22.5
31.7
37.8
12.37
-.6915908
.6915908
14.9
28.3
22.2
13.08
3.472.504
3.472.504
12.1
25.6
29.7
7.95
(2.211.091)
2.211.091
2.3
23.1
22.7
9.39
1.535.964
1.535.964
9.4
16.5
39.6
11.45
1.021.231
1.021.231
16.9
29
15.8
7.75
-1.181.158
1.181.158
15
24.3
31.7
11.03
32 21.1 16
17
18
res
abs_res 1.682.707
-.2066005
.6733371 (1.797.532) .7988743
1.105.152
(1.577.537)
(15.402)
(1.236.802)
.4052432
1.682.707 .2066005
.6733371 1.797.532 .7988743
1.105.152
1.577.537
15.402
1.236.802
.4052432
14.9
25.3
26.7
10.85
.8784354
.8784354
1.1
26.6
24.5
7.67
3.4
26.3
26.4
11.22
2.374.493
2.374.493
10.7
30.3
21.8
11.49
12.1
23
28.8
9.27
-.4913572
.4913572
6.6
12.6
31.2
6.96
2.3
30.2
31
12.7
2.883.808
2.883.808
15.9
29.5
16.3
9.39
18.2
24.4
17.2
11.96
3.156.382
3.156.382
4.1
34.2
29.4
7.18
4.5
22.6
22.3
5.94
-2.029.762
2.029.762
13.3
25.6
28.2
10.86
.7989302
.7989302
4.5
27.3
21.4
8.5
.1841868
.1841868
13
33.5
35.9
11.59
-.394672
.394672
20.1
23.3
21.1
10.89
1.422.074
1.422.074
20.8
15.3
29.9
9.59
-.443978
.443978
11.9
16
18.4
8.07
.5940896
.5940896
20.3
30.5
11.76
1.616.558
1.616.558
21.7
14.8
35.7
10.79
-.1497926
.1497926
2.3
25.2
4.94
(3.163.973)
3.163.973
8
23.3
39.5
11.03
.0655093
.0655093
16.3
25.6
9.02
(1.616.217)
1.616.217
14.2
17.2
15.7
6.43
-1.002.874
1.002.874
6.2
28.8
27.8
6.9
(269.769)
269.769
10
23.2
16.8
6
-177.752
177.752
11
30.9
31.8
7.37
(353.227)
353.227
7.7
27
26.2
12.18
285.025
285.025
13.4
(1.555.094)
1.555.094
16.2
24
19.7
10.01
1.080.544
1.080.544
7.5
17.2
17.2
6.66
-.3068667
.3068667
9.4
25
36.1
11.6
.8243966
.8243966
19.1
24.8
27.9
9.66
-.8715395
.8715395
4.8
29.8
19.5
7.84
-.4789692
.4789692
6.3
14.8
21.5
8.52
1.281.067
1.281.067
3.1
22.5
30.6
8.99
-.0622696
.0622696
12.8
17.4
32.1
12.46
2.706.969
2.706.969
19.8
33.7
33.5
14.03
1.682.707
1.682.707
14
23.3
22.1
8.48
5.2
30.3
34.3
10.41
-.2066005
.2066005
2.5
23.7
31.3
11.25
16 21.9 32
21
34.6
-.6863294 2.170.026 (1.530.472) .4361695 (2.991.666)
9
-.5091608 2.032.576
.6863294 2.170.026 1.530.472 .4361695 2.991.666
.5091608 2.032.576
2.) Mendapatkan nilai residual dan absolut residual Pada kotak comment di bawah, tuliskan kode "predict res, r" kemudian enter Maka akan muncul variabel baru yaitu residual Pada kotak comment di bawah, tuliskan kode "gen abs_res=abs(r)" kemudian enter Maka akan muncul variabel baru yaitu abs_res. variabel ini adalah nilai absolut dari variabel residual
3.) Menentukan Statistik Deskriptif Pada Menu klik Statisics, Linear models and related, regression diagnostics, "Specification test, etc", Summarize estimation sample (summarize), centang Display summary by equation, klik OK
4.) Melakukan Regresi Linear OLS
Pada Menu klik Statisics, Linear models and related, Linear regression. Masukkan variabel dependen pada kotak Dependen variable dan variabel independen pada kotak independent variables. Klik tab Reporting dan centang Standardized Beta Coefficients kemudian klik OK
Hasil Regresi :
Number of Obs = 100, artinya jumlah sample atau observasi sebanyak 100 sample
F(3, 96) artinya uji F pada DF 3 dan 96. DF 3 artinya jumlah variabel yang diuji - 1, yaitu 4-1=3 variabel. 96 adalah jumlah observasi - jumlah variabel, yaitu 100-4=96.
Nilai Uji F 0,000. Apabila nilai < 0,05 maka Uji F menerima H1 pada taraf signifikansi 5% atau yang berarti semua variabel independen secara simultan mempunyai pengaruh yang signifikan pada variabel dependen.
R-Squared adalah Koefisien Determinasi Berganda, artinya seberapa besar secara simultan semua variabel independen dapat menjelaskan variabel dependen. Di atas nilainya 0,4063 yang berarti semua variabel independen dapat menjelaskan variabel dependen sebesar 40,63%. Maka sisanya yaitu 100%-40,63%=59,37% dipengaruhi oleh variabel lain diluar model regresi.
Root MSE adalah standart error of estimate, dikatakan model regresi baik untuk dijadikan model peramalan apabila Root MSE < Standart deviasi variabel dependen (Y).
Pada kolom t adalah nilai uji t parsial. Dikatakan signifikan pada taraf 5% apabila pada kolom sebelah kanannya yaitu P>[t] atau disebut juga p value/signifikansi < 0,05.
Pada kolom Coef adalah nilai Unstandardized Koefisien Beta. Nilai koefisien beta ini yang dijadikan sebagai nilai dalam persamaan regresi. Berdasar hasil di atas, maka persamaan regresi yang dibuat adalah:
Y = 1,875 + 0,103 X1 + 0,102 X2 + 0,149 X3 + e.
Di mana Y adalah variabel dependen, 1,875 adalah konstanta, X1 variabel independen ke-1, X2 variabel independen ke-2, X3 variabel independen ke-3 dan e adalah error.
5.) Melakukan Uji Normalitas Data Uji distribusi normal adalah uji untuk mengukur apakah data yang didapatkan memiliki distribusi normal sehingga dapat dipakai dalam statistik parametrik (statistik inferensial). Dengan kata lain, uji normalitas adalah uji untuk mengetahui apakah data empirik yang didapatkan dari lapangan itu sesuai dengan distribusi teoritik tertentu. Dalam kasus ini, distribusi normal. Dengan kata lain, apakah data yang diperoleh berasal dari populasi yang berdistribusi normal. Tes-tes parametrik untuk uji normalitas dibangun dari distribusi normal. Jika kita lihat suatu tabel, misalnya tabel t-tes, pembuatannya mengacu pada tebel normalitas. Kita bisa berasumsi bahwa sampel kita bener-bener mewakili populasi sehingga hasil penelitian kita bisa digeneralisasikan pada populasi. Dalam pandangan statistic, sifat dan karakteristik populasi adalah terdistribusi secara normal. Ilustrasi sederhana, misalnya, terdapat sebuah uang logam atau koin dengan sisi gambar (G) dan sisi angka (A). Uang logam tersebut dilempar 100 kali. Sisi angka (A) keluar sebanyak 35 kali dan sisi gambar (G) keluar sebanyak 65 kali. Apakah koin tersebut dapat dikatakan seimbang? Dengan kata lain apakah koin tersebut normal? tidak rusak?, tidak gepeng?, tidak penceng?. Disinilah perlunya uji normalitas.Nah, nilai munculnya angka 35 kali dan gambar G 65 kali apakah masih tergolong wajar dalam kategori normal dilihat dari fisik mata uang logam (koin) tersebut.
a. Menggunakan Uji Skewness dan Kurtosis Pada menu, klik Statistics, "Summaries, tables, and test", Distributional plots and tables, Skewness and kurtosis normality test, masukkan variabel res pada kotak variables, klik OK
Lihat nilai Prob>chi2 pada skewness/kurtosis test for Normality. Apabila nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas nilainya 0,7028 maka residual berdistribusi normal. Sehingga berdasarkan uji Skewness Kurtosis, residual dinyatakan berdistribusi normal.
b. Menggunakan Uji Shapiro-wilk Pada menu, klik Statistics, "Summaries, tables, and test", Distributional plots and tables, Shapiro-wilk normality test, masukkan variabel res pada kotak variables, klik OK
Lihat nilai Prob>Z pada shapiro-wilk w test for Normal data. Apabila nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas nilainya 0,65937 maka residual berdistribusi normal. Sehingga berdasarkan uji Shapiro Wilk, residual dinyatakan berdistribusi normal.
c. Menggunakan Uji Shapiro-francia Pada menu, klik Statistics, "Summaries, tables, and test", Distributional plots and tables, Shapiro-francia normality test, masukkan variabel res pada kotak variables, klik OK
Lihat nilai Prob>Z pada shapiro-Francia w test for Normal data. Apabila nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas nilainya 0,88523 maka residual berdistribusi normal. Sehingga berdasarkan uji Shapiro Wilk, residual dinyatakan berdistribusi normal. Mengapa ada 3 jenis uji? seharusnya 1 uji saja sudah cukup. Pilihannya adalah bila jumlah sample atau observasi kecil < 50 sebaiknya menggunakan Shapiro-Wilk atau Shapiro-Francia. Sedangkan untuk sampel besar > 5.000, lebih baik menggunakan skewness kurtosis. Shapiro Wilk valid hanya sampai 1000 observasi sedangkan Shapiro Francia hingga 5000.
d. Menggunakan Grafik Plot Probabilitas Normal
Pada menu, klik Statistics, "Summaries, tables, and test", Distributional plots and tables, "Normal probability plot, standardized", masukkan variabel res pada kotak variable, klik OK
Persebaran data mendekati grafik diagonal, plot-plot mengikuti garis fit line, maka variabel berdistribusi normal. e. Menggunakan Grafik Plot Probabilitas Normal Pada menu, klik Graphics, Histogram, masukkan variabel res pada kotak variable, klik OK
Di atas diagram menyerupai bel menghadap ke atas, maka dinyatakan berdistribusi normal.
f. Menggunakan tampilan Steam-and-leaf Pada Menu, klik Statistics, kemudian klik (Summaries, tables and tests), Distributional plots and test, Pilih Steam-and-leaf display., Kemudian isi Combobox Variabel dengan Variabel yang akan diuji yaitu res. Klik OK.
Angka-angka membentuk kurve normal miring ke arah kanan, maka variabel berdistribusi normal
g. Menggunakan grafik Box Plot Pada Menu, Klik Graphics, Distributional Graphs, Box Plot, Kemudian isi Combobox Variabel dengan Variabel yang akan diuji yaitu res. Klik OK. Pada gambar di samping, Box berada ditengah dengan kedua kaki yang sama panjang, garis horizontal berada ditengah box dan tidak terdapat plot-plot di atas atau di bawah box, maka variabel berdistribusi normal.
6.) Melakukan Uji Heteroskedastisitas
Heteroskedastisitas adalah adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. Varians adalah jumlah kuadrat dari selisih nilai data observasi dari nilai rata-ratanya, kemudian dibagi dengan jumlah observasinya. Varians digunakan untuk mengetahui seberapa jauh persebaran nilai hasil observarsi terhadap rata-rata. Rumus Varians :
Uji Heteroskedastisitas dilakukan untuk melihat terjadinya gangguan yang muncul dalam fungsi regresi yang mempunyai varian yang tidak sama sehingga penaksir OLS tidak efisien baik dalam sampel kecil maupun sampel besar (tapi masih tetap tidak bias dan konsisten). Salah satu cara untuk mendeteksi masalah heteroskedastisitas adalah dengan uji Park. Hasil perhitungan dilakukan uji t. Kriteria pengujiannya adalah apabila t hitung < t tabel, maka antara variabel bebas tidak terkena heteroskedastisitas terhadap nilai residual lain, atau varians residual model regresi ini adalah homogen. Demikian sebaliknya. a. Menggunakan Metode Breusch-pagan
Pada Menu klik Statisics, Linear models and related, regression diagnostics, "Specification test, etc", Test for heteroskedasticity (hettest), klik OK
Uji regresi linear harus mempunyai sifat homoskedastisitas. Untuk uji heteroskedastisitas banyak metode, tetapi yang dogunakan dibawah adalah metode Breusch-Pagan. Dikatakan tidak terjadi gejala heteroskedastisitas apabila nilai P value yang ditunjukkan dengan "Prob > chi2" nilainya > 0,05. Hasil di atas nilai p value sebesar 0,7451 di mana > 0,05 maka model regresi bebas dari gejala heteroskedastisitas atau disebut juga bersifat homoskedastisitas.
b. Menggunakan metode grafik scatter antara fitted value dan residual Pada Menu klik Statisics, Linear models and related, regression diagnostics, Residual versus fitted plot, klik OK
Apabila plot menyebar merata di atas dan di bawah sumbu 0 dan tidak membentuk sebuah pola tertentu, maka dinyatakan tidak ada gejala heteroskedastisitas.Pada Diagram di atas, plot menyebar merata di atas dan di bawah sumbu 0 dan tidak membentuk sebuah pola tertentu, maka dinyatakan tidak ada gejala heteroskedastisitas.
7.) Melakukan Uji Multikolinearitas Multikolinearitas bisa diartikan dengan mudah yaitu terdapat korelasi kuat antar variabel independen. Model regresi yang bagus harus bebas dari gejala multikolinearitas. Karena multikolinearitas adalah korelasi antar variabel independen, maka asumsi ini hanya berlaku pada uji regresi linear berganda di mana terdapat lebih dari satu variabel independen.
Pada Menu klik Statisics, Linear models and related, regression diagnostics, "Specification test, etc", Variance inflating factor for independent variables (vif), klik OK
Lihat nilai VIF dan 1/VIF di atas, apabila VIF < 10 dan 1/VIF > 0,1 maka dapat dikatakan bahwa model regresi linear berganda bebas gejala multikolinearitas. Nilai 1/VIF bisa disebut juga dengan istilah "Tolerance".
View more...
Comments