March 14, 2019 | Author: Acita CcaRha'hayoe Jipi | Category: N/A
Download Multilevel Logistik Ordinal Biner...
PERBANDINGAN REGRESI LOGISTIK DAN MODEL MULTILEVEL PADA DATA ORDINAL DAN BINER UNTUK MENGETAHUI VARIABEL YANG MEMPENGARUHI HASIL BELAJAR MENGAJAR KALKULUS I DI ITS 1
2
Soehermin Ari Poedjiati, Prof. Dra. Susanti Linuwih, M.Stat.,Ph.D, dan 3 Ir. Dwiatmono AW, M.Ikom. 1
Mahasiswa Program Pasca Sarjana - Magister Statistika, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim Surabaya – Indonesia 2,3
Jurusan Statistika, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim Surabaya – Indonesia
e-mail : 1
[email protected] [email protected],, 2
[email protected] [email protected],, 3
[email protected]
Abstrak. Kalkulus merupakan mata kuliah yang cukup penting di ITS karena kalkulus merupakan ilmu yang mendasari perkembangan teknologi modern, mempunyai peran penting dalam berbagai disiplin ilmu dan mengembangkan daya pikir manusia. Oleh karenanya, mengetahui variabel apa saja yang berpengaruh pada pencapaian nilai kalkulus adalah merupakan hal yang cukup penting. Karena variabel respon, yakni nilai kalkulus memiliki skala pengukuran ordinal maka pemodelan nilai Kalkulus I dilakukan dengan memanfaatkan pemodelan ordinal, diantaranya adalah regresi logistik ordinal dan model multilevel ordinal. Namun, untuk mengetahui variabel yang berpengaruh pada kelulusan mahasiswa yang mengambil mata kuliah Kalkulus dapat diterapkan regresi logistik binner maupun model multilevel binner. Model Multilevel dipilih karena ada dugaan awal, bahwa terdapat variabilitas nilai yang besar antar fakultas di ITS. Untuk mendapatkan masing-masing model, dilakukan estimasi parameter, salah satunya adalah dengan metode maximum likelihood estimator (MLE). Dari hasil pengolahan data terdapat masing-masing 6 model pada logistik ordinal dan multilevel ordinal serta masing-masing satu model logistik binner dan multilevel binner. Namun karena persentase kesalahan prediksi dari model yang diperoleh dari regresi logistik binner adalah yang paling rendah, maka model yang dipilih digunakan dalam menganalisis variabel yang berpengaruh pada hasil proses belajar mengajar Kalkulus I di ITS adalah regresi logistik binner. Dari hasil pengujian parameter secara individu, diketahui hanya 4 variabel diantara 7 variabel yang signifikan mempengaruhi hasil belajar mengajar Kalkulus I mahasiswa ITS yaitu : pendidikan di sekolah menengah atas, asal daerah (Jawa Timur selain Surabaya dibandingkan Surabaya), nilai matematika SMA dan jenis kelamin.
Kata Kunci: Regresi Logistik Ordinal, Regresi Logistik Binner, Model Multilevel Ordinal, Model Multilevel Binner, Nilai Kalkulus
1. Pendahuluan Kalkulus merupakan ilmu universal yang mendasari perkembangan perkembangan tehnologi modern, mempunyai mempunyai peran penting dalam berbagai disiplin ilmu dan mengembangkan daya pikir manusia. Di ITS, mata kuliah kalkulus merupakan mata kuliah wajib di hampir semua jurusan dan bagi hampir seluruh mahasiswa baru, karena sebagai bekal mempelajari mempelajari ilmu-ilmu lainnya. lainnya. Sangat diharapkan nilai untuk mata mata kuliah ini minimal adalah D. Namun pada kenyataannya tidak semuanya mahasiswa dapat dinyatakan lulus pada pengambilan pertama. pertama. Nilai kalkulus di ITS dinyatakan dengan grade A sampai dengan E. Grade ini merupakan penilaian dengan skala ordinal. Sehingga analisa yang digunakan merupakan analisa data kategorik yang berskala ordinal, seperti Regresi Logistik Ordinal dan Model Multilevel Biner. Namun, karena keputusan akhir dari proses belajar mengajar adalah menyatakan bahwa seorang mahasiswa lulus atau tidak lulus (mengulang), maka dalam penelitian ini juga akan diamati model jika variabel respon nya adalah variabel
kategorik dengan 2 kategori yaitu lulus atau tidak lulus Kalkulus I dengan Regresi Logistik Biner dan Model Multilevel Biner. Model multilevel dipilih karena diyakini dapat memperkecil kesalahan pada model dibandingkan pemodelan sederhana (Hedeker, 2004). Berkaitan dengan paparan diatas, maka dapat dirumuskan tujuan dari penelitian adalah untuk mencari estimasi parameter dari model yang paling sesuai berdasarkan ketepatan dugaannya agar selanjutnya dapat dilakukan dianalisa mengenai variabel-variabel yang mempengaruhi hasil proses belajar mengajar Kalkulus I di ITS.
2. Dasar Teori 2.1. Regresi Logistik Biner Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan variabel respon (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor (X), baik itu yang bersifat kategori maupun kontinu. Apabila variabel responnya terdiri dari 2 kategori yaitu Y=1 (sukses) dan Y=0 (gagal) maka metode regresi logistik yang dapat diterapkan adalah regresi logistik biner. Untuk satu buah objek penelitian, kondisi dengan 2 kategori tersebut mengakibatkan y berdistribusi Bernoulli. Fungsi
distribusi peluang untuk y dengan parameter γ adalah P(Y=y)= γ (1 − γ ) y
probabilitas untuk masing-masing kategori adalah P(Y=1)= 0≤
1− y
dengan y=0,1. Sehingga
γ dan P(Y=0)=1- γ dengan E(y)= γ ,
γ ≤ 1. Secara umum model probabilitas regresi logistik dengan melibatkan beberapa variabel
prediktor (x) dapat diformulasikan sebagai berikut : E(y x ) =
e
( β 0 + β 1 x1 + β 2 x2 +...+ β p x p )
1+ e
(1)
( β 0 + β 1 x1 + β 2 x2 +...+ β p x p )
Fungsi γ ( x) merupakan fungsi non linier sehingga perlu dilakukan transformasi logit untuk memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel respon (y) dengan variabel prediktornya (x) (Hosmer dan Lemeshow, 2000). Bentuk logit dari γ ( x) dinyatakan sebagai g ( x) , yaitu :
⎛ γ ( x) ⎞ ⎟⎟ 1 − γ ( x ) ⎝ ⎠
g ( x) = ln⎜⎜
(2)
sehingga setelah persamaan (1) disubstitusikan pada (2) akan diperoleh :
⎛ γ ( x) ⎞ ⎟⎟ = β 0 + β 1 x1 + β 2 x2 + ... + β p x p ⎝ 1 − γ ( x) ⎠
ln⎜⎜
(3)
Salah satu metode yang dapat digunakan dalam mengestimasi parameter model regresi logistik adalah Maximum Estimation Likelihood (MLE). Pada dasarnya metode ini memberikan nilai estimasi parameter β dengan cara memaksimumkan fungsi likelihood-nya. Jika fungsi distribusi peluang untuk y i y i
adalah f(yi)= γ
(1 − γ ) − i , maka fungsi likelihood untuk n pengamatan independen adalah : 1 y
n
L β 0 , β 1 , β 2 ,..., β p
=
∏ {[γ ( x )]
yi
i
[1 − γ ( xi )]1− y } i
i =1 n
=
∏ i =1
⎧⎪⎡ γ ( x ) ⎤ y ⎫⎪ i [ ] 1 − γ ( ) x ⎨⎢ ⎥ i ⎬ ⎪⎩⎣1 − γ ( xi ) ⎦ ⎪⎭ i
n
⎡
=⎢
γ ( xi )
y ⎤ ∑=
⎥ ⎣1 − γ ( xi ) ⎦
i
i 1
[1 − γ ( xi )]n
(4)
Berdasarkan fungsi likelihood didapatkan ln fungsi likelihoodnya sebagai berikut :
2
ln L β 0 , β 1 , β 2 ,..., β p
= l ( β 0 , β 1 , β 2 ,..., β p ) ⎧ = ln ⎪ ⎨ ⎪⎩ =
n
∑ i =1
=
n
∏ i =1
⎧⎪ ⎡ γ ( x ) ⎤ y i ⎫⎫ i [1 − γ ( x i ) ]⎪⎬ ⎪⎬ ⎨⎢ ⎥ ⎪⎩ ⎣ 1 − γ ( x i ) ⎦ ⎪⎭ ⎪⎭
⎧ ⎧ ⎡ γ ( x ) ⎤ y ⎫⎫ ⎪ ln ⎪ i [1 − γ ( x i ) ]⎪⎬ ⎪⎬ ⎨ ⎨⎢ ⎥ ⎪⎩ ⎪⎩ ⎣ 1 − γ ( x i ) ⎦ ⎪⎭ ⎪⎭ i
n
∑{ y ( β + β x + β x + ... + β x ) + ln[1 + e(
β 0 + β 1 x1 + β 2 x2 +...+ β p x p
i
0
1 1
2 2
p p
)
]}
(5)
i =1
Estimasi parameter regresi logistik didapatkan dari turunan parsial pertama fungsi ln likelihood terhadap parameter yang akan diestimasi kemudian disamakan dengan nol. 2.2 Regresi Logistik Ordinal Regresi Logistik Ordinal merupakan salah satu metode statistika yang dipergunakan untuk menganalisis data dengan variabel respon berskala ordinal. Sifat ordinal dituangkan dalam peluang kumulatif. Sebagaimana dalam model linier lainnya, sedangkan variabel independen dapat berupa peubah kontinu atau variabel yang berskala kategorik (Agresti, 1990). Apabila terdapat sampel random dari distribusi bersama (Y, X), dimana Y merupakan variabel respon berskala ordinal dan X′ = (X1, X2, …X p) adalah vektor variabel prediktor. Variabel respon Y dengan k kategori dapat dipandang sebagai k titik
~
θr berada diantara θ0 = -∞ dan θk = ~ +∞, maka dapat dinyatakan bahwa θr-1 < Y < θr untuk r = 1,2,…, k-1, sedangkan - ∞ = θ0 < θ1 < … < θk = ~ ∞ dengan mengasumsikan bahwa variabel Y ditentukan oleh variabel prediktor dengan bentuk linier pada (2.4) dimana β′ = (β1, ..., β p) adalah vektor koefisien. ~ (6) Y = θr + β′ X Selanjutnya, bila peluang klasifikasi πr (X) merupakan peluang klasifikasi yang didefinisikan sebagai P(Y=r|X) pada variabel acak kontinu tak teramati ( Y ). Sehingga bila Y=r dan
dari variabel respon Y pada nilai X’ = (X1, X2, …X p). maka peluang kumulatif dapat dinyatakan pada (2.2). P(Y ≤ r | x) = F (θ r + β' X)
(7)
= P(Y = 1 | X) + P(Y = 2 | X) + ... + P(Y = r | X) ~ Fungsi distribusi logistik didefinisikan sebagai : F (Y ) =
Maka P(Y ≤ r | X) = F (θ r + β' X) ( + β 'X ) e θ r = (θ +β 'X)
1+ e
1 ~
1 + e −Y
(8)
r
Dengan r = 1,2,....,(k-1) Sehingga :
⎡ P(Y ≤ r | X) ⎤ ⎥ = θ + β' x ⎣1 − P(Y ≤ r | X) ⎦ r
logit[P(Y ≤ r | X) ] = ln ⎢
(9)
Jika θr-1 < θr maka model ini adalah model kumulatif dengan slope yang sama, yaitu model garis regresi yang berdasar pada peluang kumulatif kategori respon. Jika terdapat k kategori respon, maka model logistik ordinal yang terbentuk adalah : (10) ⎛ γ ⎞ logit(γ i ) = ln⎜⎜
⎟⎟ = θ + β' X ⎝ 1 − γ ⎠ i
i
i
Dengan i =1, 2,...(k-1) Salah satu cara estimasi parameter yang dapat dipergunakan pada regresi logistik ordinal adalah dengan Maximum Likelihood Estimator (MLE). Konsepnya adalah memaksimumkan fungsi likelihood dari sampel random untuk menduga parameter (Hosmer dan Lemeshow, 2000). Ketika lebih dari satu observasi Y muncul pada nilai Xi, adalah cukup menyatakan jumlah obeservasi untuk setiap munculnya nilai r pada Y dengan n ri, dimana r adalah kategori tertentu dari variabel respon ( r =1,..., k )
3
(Kim, 2004). Maka [Y i,i=1,..., n] merupakan variabel random yang berdistribusi multinomial independen dengan E(Yi) = nri γ r (Xi), sedemikian hingga dapat dinyatakan : R 1i = n1i (11) R 2i = n1i + n2i (12) ... k
R ri =
∑n
r
=n
(13)
r =1
Karena peluang kumulatif yang digunakan dalam menaksir parameter, maka likelihood dapat ditulis sebagai perkalian (k-1) kategori, sehingga fungsi likelihood dapat dinyatakan sebagai fungsi kepadatan peluang bersama pada persamaan 2.20 (Kim, 2004). n
L(θ, β )
=
∏ f (x ) f ( y | x ) i
i
i
i =1
n
=
∏ [a x b x... x m]
(14)
i =1
dimana :
⎧⎪⎛ γ ⎞ R ⎛ γ − γ ⎞ R − R ⎫⎪ 1i ⎟⎟ a = ⎨⎜⎜ 1i ⎟⎟ ⎜⎜ 2i ⎬ γ γ ⎪⎩⎝ 2i ⎠ ⎝ 2i ⎠ ⎪⎭ ⎧⎪⎛ γ ⎞ R ⎛ γ − γ ⎞ R − R ⎫⎪ 2i ⎟⎟ b = ⎨⎜⎜ 2i ⎟⎟ ⎜⎜ 3i ⎬ γ γ ⎪⎩⎝ 3i ⎠ ⎝ 3i ⎠ ⎪⎭ ⎧⎪⎛ γ (k -1)i ⎞ R( −1) ⎛ γ ki − γ ( k −1)i ⎞ R ⎟ ⎜ ⎟ m = ⎨⎜ ⎜ ⎟ ⎜ ⎟ ⎝ γ ki ⎠ ⎪⎩⎝ γ ki ⎠ 1i
2i
1i
2i
3i
2i
k
i
ki
− R( k −1) i ⎫
⎪ ⎬ ⎪⎭
Selanjutnya untuk mendapatkan matrik informasi Fisher, dicari ln dari fungsi likelihood. Langkah awal estimasi parameter dari regresi logistik ordinal melalui MLE ( Maximum Likelihood Estimator) adalah dengan memaksimalkan turunan fungsi log likelihood pada terhadap parameter. Untuk mendapatkan estimasi parameter dari kedua persamaan tersebut digunakanlah metode Newton Raphson dengan iterasi Weighted Least Square. 2.3 Model Multilevel Biner Pada saat data respon merupakan variabel kategorik yang terdiri dari 2 kategori, maka model multilevel yang dapat diterapkan adalah model multilevel biner. Sebagai contoh, bila y=1 menyatakan sukses dan y=0 menyatakan gagal, maka probabilitas akan terjadi sukses pada subyek ke- i dan level ke- j
dinyatakan dengan P(Y=1) = γ ij dan probabilitas akan terjadi gagal pada subyek ke- i dan level ke- j dinyatakan dengan P(Y=0) = 1- γ ij . Sehingga varians Y dinyatakan sebagai var(Y ij ) = γ ij (1 − γ ij ) . Untuk keperluan pemodelan multilevel maka digunakan model logit, sedemikian hingga untuk 1 variabel prediktor dapat dinyatakan :
⎛
⎞ ⎟ ⎟ 1 − γ ij ⎝ ⎠
( ) = ln⎜⎜
log it γ ij
γ ij
= β 0 j
+ β ij xij + eij
(15)
Dan secara umum, model multilevel biner dapat dinyatakan pada (16).
⎧
⎫⎪ ⎬ = β 0 j + X′ij β + z ′ j u 0 j ⎪⎩1 − γ ij ⎪⎭
{ }= ln⎪⎨
logit γ ij
γ ij
(16)
Salah satu cara yang dapat digunakan untuk melakukan estimasi parameter pada model multilevel biner adalah dengan metode Maximum Likelihood Estimator (MLE) (Flom, 2008). Fungsi likelihood yang digunakan untuk menyelesaikan estimasi parameter pada model multilevel biner dinyatakan pada (17).
4
+∞
(
2
L γ , σ u0 |y, x, z
) = ∏ ∫ ∏ g (Yij |Xij , z j , u0 j ) f (u0 j )du0 j j
−∞
(17)
i
dimana :
g (y ij |xij , z j , u0 j ) = γ ij ij (1 − γ ij ) y
1− y ij
Selanjutnya PROC NLMIXED dengan iterasi Gaussian Quadrature digunakan untuk menyelesaikan integrasi pada (17). 2.4. Model Multilevel Ordinal Pada saat data respon berskala ordinal, maka model multilevel linear atau yang dibahas pada model multilevel point skor tidak dapat langsung diterapkan. Oleh karenanya digunakan pendekatan ( k )
model logit, sehingga variabel respon yang dinyatakan dengan γ ij
merupakan probabilitas subjek ke- i
pada level ke- j berada pada suatu tingkatan (Bauer dan Sterba, 2007). Tingkatan atau order dari variabel respon dinotasikan dengan k, yaitu nilai berskala ordinal ( k =1,2,3,...K). Selanjutnya dapat dinyatakan bahwa
0 < γ ij(1)
< γ ij( 2) < ... < γ ij( K ) = 1 (Fielding, dkk, 2003). ( k )
Dengan menganalogikan model pada (2.21), untuk variabel respon γ ij
yang mengikuti distribusi
multinomial dapat dinyatakan model logit untuk kasus data multilevel ordinal dinyatakan pada (18).
⎧ γ ij(k ) ⎫⎪ = θ k + u 0 j ( k ) ⎬ ⎪⎩1 − γ ij ⎪⎭
⎪ logit{γ }= ln ⎨ k ij
(18)
dimana : = intersep model ( θ 1 , θ 2 , … θ k −1 )
θ k
Jika terdapat sejumlah variabel prediktor, maka akan menambah parameter sehingga diperoleh model pada (19 )
⎧
{ }= ln⎪⎨
logit γ ijk
( k )
γ ij
⎪⎩1 −
( k ) γ ij
⎫⎪ ⎬ = θ k + X′ij β + u 0 j ⎪⎭
(19)
Dan dengan bentuk umum, model pada (19), dapat dinyatakan dalam persamaan sebagaimana tertulis pada (20).
⎧
⎫⎪ = θ k + X′ij β + Z ′ij u j ( k ) ⎬ ⎪⎩1 − γ ij ⎪⎭
{ }= ln ⎪⎨
logit γ ijk
( )
γ ijk
(20)
Salah satu cara yang dapat digunakan untuk melakukan estimasi parameter pada model multilevel adalah dengan metode Maximum Likelihood Estimator (MLE). Pfeffermann, Skinner, Holmes, Goldstein, Korn dan Graubard dalam Grili dan Pratesi (2004) menyatakan bahwa model multilevel ordinal seperti pada (2.40) dapat dinyatakan dalam bentuk linier melalui variabel laten untuk mempermudah mendapatkan estimasi parameternya. Untuk model multilevel ordinal dengan 2 level, variabel respon yang berskala ordinal (Y) dengan k tingkatan ( k =1,2,...K) dinyatakan melalui variabel
~
laten berskala kontinu Y yang mengikuti model komponen varians pada (21) (Hedeker dan Gibbons, 1994). ~ Y ij = β' x ij + u j + eij (21) dengan : xij : vektor kovariat : vektor slope (parameter) eij : variabel random pada unit sampel (level 1), diasumsikan IID dengan mean nol dan varians ( σ2) tidak diketahui : variabel random pada model level 2, diasumsikan IIDN dengan mean nol dan varians adalah u j satu dan u ij j saling independen.
5
~
Variabel respon berskala ordinal, Y terhubung dangan variabel laten Y melalui hubungan pada persamaan (22) (Grili dan Pratesi, 2004; Hedeker, dkk, 2006). ~ (22) {Y ij = k } ⇔ {γ k −1 < Y ij ≤ γ k }
γ 0
Model pada (22) memuat batasan bahwa
≤ γ 1 ≤ ... ≤ γ k −1 ≤ γ k
(Hedeker, dkk, 2006). Sehingga,
model probabilitas bersyarat respon pada level tertentu dengan syarat u j dinyatakan pada (23). ~ ~ P(Y ij = γ k | u j ) = P(Y ij ≤ γ k | u j ) − P(Y ij ≤ γ k −1 | u j )
(23)
dimana :
~ P(Y ij
≤ γ k | u j ) = P(ε ij ≤ γ k − [β' x ij + u j ] | u j ) = F (γ σ ,k − [βσ ' x ij + u j ]) '
Dan F (γ σ ,k − [β σ x ij
+ u j ])
merupakan fungsi penghubung ( link function) yang diperoleh dari fungsi
distribusi residual pada level pertama ( εij/σ) Misalkan terdapat yang merupakan vektor untuk semua parameter yang estimable meliputi βσ, ωσ dan sebanyak K-2 batasan {γσ,k : k = 2, …, K-1} dimana γσ,1 adalah sama dengan nol, maka dapat dinyatakan fungsi likelihood bersyarat untuk subjek pengamatan ke- i pada level ke- j seperti pada (24). n K d (24) [ P(Y = k | β , β )] l (Y | β , β ) = i
i
0 j
p
∏∏ j =1 k =1
ijk
ij
0 j
p
Selanjutnya dicari fungsi likelihood marginal untuk kelompok ke- j, dimana ϕ adalah fungsi kepadatan peluang dari sebaran normal standar sehingga fungsi likelihood marginal untuk kelompok ke- j juga dapat dituliskan seperti pada (25).
L j (θ) =
+∞
n j
−∞
i =1
∫ ∏ L (θ | u) ϕ (u )du
(25)
ij
Estimasi parameter selanjutnya diperoleh dengan memaksimalkan fungsi pada (2.34) melalui iterasi Gaussian Quadrature (Grilli dan Pratesi, 2002; Grilli dan Pratesi, 2004) dengan bantuan PROC NLMIXED pada software SAS .
3. Metodologi Penelitian 3.1 Sumber Data Dalam penelitian ini digunakan data mahasiswa S1 ITS semester I tahun ajaran 2007/2008 yang diperoleh dari BAAK dan TPB-ITS. 3.2 Identifikasi Variabel Menurut beberapa teori dan penelitian terdahulu, hal-hal yang dapat mempengaruhi nilai atau prestasi akademik siswa bisa berasal dari kondisi internal siswa maupun kondisi eksternal siswa. Dari informasi ini, maka dipilihlah beberapa variabel yang akan dianalisis terkait dengan evaluasi faktor-faktor yang mempengaruhi nilai kalkulus I mahasiswa strata I di ITS Surabaya. Secara umum, model hipotesis pada Gambar 1 menggambarkan dugaan sementara hubungan antar masing-masing variabel dengan nilai kalkulus I mahasiswa ITS. (Kemamp. Akademik) N i l a i M a t – S M A ( X3 )
J e n is K e lam in ( X4)
H A S IL E V A L U A SI ( N i l a i / P r e st a s i A k a d e m i k ) Ni la i Ka lk u lu s I Mh s.
(Lingk. Keluarga) Asal Dae r ah (X2)
Jalu r Masu k ( X5)
(Lingk. Pendidikan) Ju m lah Lat ih an / Qu iz (X7) (Lingk. Pendidikan) Ti n gk at Pe n d id ik an / ge lar d ose n (X 6)
(Lingk. Pendidikan) Pen d id ilan Seb elu m (X1 )
Gambar 3.1. Model Hipotesis Hubungan Antar Variabel dengan Nilai Kalkulus I Mahasiswa ITS
6
3.3 Langkah-langkah Penelitian Terkait dengan tujuan penelitian yang telah dikemukakan pada bagian Pendahuluan, maka beberapa tahapan diperlukan untuk dapat menjawab tujuan tersebut, yaitu : a. Mencari estimasi parameter dari Regresi Logistik Ordinal dan Model Multilevel Ordinal a.1. Mencari estimasi parameter dari Regresi Logistik Ordinal, dengan langkah-langkah : 1. Mengumpulkan pengamatan dan mendefinisikan variabel respon (y) adalah nilai kalkulus I mahasiswa ITS dengan 7 kategori, sehingga ditetapkan k =7. 2. Menyelesaikan estimasi parameter dari turunan fungsi log likelihood dengan metode Newton Raphson melalui iterasi Weighted Least Square pada software Minitab 14 3. Melakukan pengujian signifikansi model melalui uji serentak dan melakukan pengujian individu pada parameter. 4. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.1.3.
a.2. Mencari estimasi parameter pada Model Multilevel Biner dengan langkah-langkah : 1. Menentukan variabel respon y ij adalah nilai kalkulus I mahasiswa S1 tahun ajaran 2007/2008 yang berskala ordinal. 2. Menentukan model umum multilevel ordinal adalah seperti pada (2.25), dengan 7 kategori pada variabel respon sehingga ditetapkan k = 1, 2, 3, 4, 5, 6, 7. 3. Menetapkan banyaknya level adalah 2 dan banyaknya kelompok pada level 2 adalah 5. 4. Mencari estimasi parameter melalui iterasi Gaussian Quadratur dan bantuan program komputer : SAS PROC NLMIXED. 5. Melakukan pengujian signifikansi model dengan cara yang sama seperti pada langkah a.1.3. 6. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.2.4 dan telah diuji pada langkah a.2.5 dan a.2.6. b.
Mencari estimasi parameter dari Regresi Logistik Biner dan Model Multilevel Biner dengan langkahlangkah : b.1. Mencari estimasi parameter dari Regresi Logistik Biner, dengan langkah-langkah : 1. Mengumpulkan pengamatan dan mendefinisikan variabel respon (y) adalah hasil kalkulus I mahasiswa ITS dengan 2 kategori. 2. Menyelesaikan estimasi parameter dari turunan fungsi log likelihood dengan metode Newton Raphson melalui iterasi Weighted Least Square pada software Minitab 14 3. Melakukan pengujian signifikansi model melalui uji serentak melakukan pengujian individu pada parameter, untuk menguji peran dari masing-masing variabel prediktor. 4. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.1.3. b.2. Mencari estimasi parameter pada Model Multilevel Ordinal dengan langkah-langkah : 1. Menentukan variabel respon y ij adalah hasil kuliah kalkulus I mahasiswa S1 tahun ajaran 2007/2008 yang berskala ordinal. 2. Menentukan model umum multilevel ordinal adalah seperti pada (2.29), dengan 2 kategori pada variabel respon. 3. Menetapkan banyaknya level adalah 2 dan banyaknya kelompok pada level 2 adalah 5. 4. Mencari estimasi parameter melalui iterasi Gaussian Quadratur dan bantuan program komputer : SAS PROC NLMIXED. 5. Melakukan pengujian signifikansi model dengan cara yang sama seperti pada langkah a.1.3. 6. Menyatakan model akhir, yaitu model dimana parameter telah diduga pada langkah a.2.4 dan telah diuji pada langkah a.2.5 dan a.2.6.
c.
Membandingkan besarnya kesalahan prediksi pada Regresi Logistik Biner, Regresi Logistik Ordinal, Model Multilevel Biner dan Model Multilevel Ordinal, untuk memilih model yang paling sesuai, dengan mencari nilai dugaan untuk variabel respon ( yˆ ) dari masing-masing model regresi logistik dan multilevel pada langkah a.1.4, a.2.6, b.1.4 dan b.2.6. Selanjutnya, dihitung persentase ketepatan dugaan perbedaan antara dugaan masing-masing model. Model yang dinyatakan memberikan dugaan lebih baik adalah model yang persentase selisih antara nilai dugaan dan nilai sebenarnya adalah yang terkecil.
d.
Melakukan analisa variabel-variabel yang mempengaruhi nilai kalkulus I mahasiswa ITS Surabaya dengan melakukan interpretasi pada model yang memberikan tingkat kesalahan terkecil dari langkah (b). 7
4. Analisa Data dan Pembahasan 4.1 Deskripsi Data
Berdasarkan data yang diperoleh dari BAAK ITS, pada tahun ajaran 2007/2008 terdapat 1949 mahasiswa baru yang mengikuti mata kuliah Kalkulus I dan terbagi atas 39 kelas. Hasil dari proses belajar mengajar Kalkulus I untuk 1945 mahasiswa tersebut, ditunjukkan pada Gambar 2. Pie Chart of NI LAI_KALK E 120; 6,2% A 380; 19,5% D 358; 18,4%
Category A AB B BC C D E
AB 366; 18,8% C 278; 14,3%
BC 211; 10,8%
B 232; 11,9%
Gambar 2. Pie Chart Nilai Kalkulus I Mahasiswa ITS
tampak bahwa mahasiswa yang mendapatkan nilai rendah dan tidak dinyatakan lulus pada mata kuliah Kalkulus I sebanyak 120 mahasiswa atau sebanyak 6,2% dari total mahasiswa yang mengambil mata kuliah Kalkulus I pada tahun ajaran 2007/2008. 4.2. Perbandingan Hasil Estimasi Parameter Dalam penelitian ini, parameter β diestimasi dengan menggunakan metode Maximum Likelihood Estimation (MLE). Dari masing-masing metode, diperoleh estimasi β dan akhirnya dapat dihitung ketepatan prediksi dari masing-masing model. Perbandingan hasil estimasi parameter dari keempat metode disajikan pada Tabel 1. Tabel 1 menunjukkan bahwa model logistik memberikan tingkat kesalahan klasifikasi lebih kecil daripada model multilevel. Ini berlaku pada data biner maupun data ordinal. Pada model ordinal, tingkat kesalahan klasifikasi tergolong besar (yakni diatas 70%). Kemungkinan yang menyebabkan hal ini adalah bahwa variabel-variabel prediktor yang dipakai dalam penelitian, bukan merupakan variabel utama yang mempengaruhi nilai Kalkulus I mahasiswa ITS. Sehingga model yang dihasilkan tidak cukup untuk dapat menduga nilai Kalkulus I mahasiswa. Namun, untuk mengetahui variabel yang mempengaruhi kelulusan seorang siswa dari proses belajar mengajar Kalkulus I di ITS, model regresi logistik biner dan multilevel biner menghasilkan kesalahan prediksi kurang dari 10%. Karena, regresi logistik biner memberikan tingkat kesalahan prediksi terkecil, maka selanjutnya untuk mengetahui variabel yang mempengaruhi hasil proses belajar mengajar Kalkulus I mahasiswa ITS digunakan regresi logistik biner. Berdasarkan hasil estimasi dan pengujian parameter regresi logistik biner, diketahui terdapat 4 (empat) variabel prediktor yang mempengaruhi kelulusan untuk mata kuliah Kalkulus I di ITS, yaitu : X1 (Pendidikan di sekolah menengah atas), yaitu sekolah SMA dibandingkan selain SMA. X2 (Asal Daerah), yaitu daerah asal Jawa Timur selain Surabaya dibandingkan daerah asal Surabaya dan daerah asal diluar Jawa Timur dibandingkan daerah asal Surabaya X3 (Nilai Matematika di SMA) X4 (Jenis Kelamin), yaitu jenis kelamin laki-laki dibandingkan perempuan
8
Tabel 1. Perbandingan Koefisien dan Prosentase Kesalahan Prediksi Model ORDINAL BINER LOGISTIK MULTILEVEL LOGISTIK MULTILEVEL p pParameter Koefisien p-value Koefisien p-value Koefisien value Koefisien value Konstan (θ1) 2,17817 0,000 2,24900 0,005 0,27232 0,800 0,66100 0,5942 Konstan (θ2) 3,89308 0,000 4,01400 0,000 Konstan (θ3) 4,62948 0,000 4,78220 0,000 Konstan (θ4) 5,11564 0,000 5,29220