Jurnal Diabetes Mellitus

April 12, 2019 | Author: Deni Priyantoro | Category: N/A
Share Embed Donate


Short Description

jurnal diabetes melitus...

Description

DIAGNOSA PENYAKIT DIABETES MELLITUS DENGAN METODE NAÏVE BAYES BERBASIS DESKTOP APPLICATION 1 







5

Al mir a Sya Syawli  wli , Gopi Yudoyo , M. Ali F ahmi , Sil Sil via Ar i Santhy , Zulkar naein  naein  1. Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya,  Malang, 65145, Indonesia Indonesia 2.  Program Teknologi Teknologi Informasi dan Ilmu Komputer, Universitas Universitas Brawijaya, Brawijaya, Malang, 65145, 65145,  Indonesia 1 2 3  Email: [email protected] ,  [email protected]  [email protected] om , [email protected] , 4 5  [email protected]  silvia.aska@gma il.com , zulkhafourze@  , [email protected] gmail.com

Abstrak

Bidang kesehatan merupakan salah satu bidang yang sudah menerapkan berbagai teknologi teknolo gi komputer. Untuk melakukan diagnosa penyakit yang diderita pasien pun sudah dilakukan dengan bantuan komputer. Salah satunya adalah untuk mendiagnosa penyakit diabetes mellitus yang dapat terjadi pada siapa pun. Penyakit diabetes mellitus merupakan salah satu jenis penyakit yang sering ditemukan pada masyarakat. Penyakit ini juga merupakan penyebab kematian terbesar keempat di dunia, dan di Indonesia terutama di kota-kota besar seperti Jakarta dan Surabaya sudah hampir 10 persen  penduduknya mengidap diabetes. Oleh karena itu, penelitian ini bertujuan untuk mencegah mencegah masalah masalah tersebut dengan bantuan sistem pakar. Dalam hal ini, pasien dapat memasukkan berbagai gejala yang mengindikasi penyakit Diabetes Mellitus. Dari gejala yang dimasukkan, dapat diketahui prediksi  bahwa pasien terkena atau tidak terkena Diabetes Mellitus dengan metode Naive Bayes. Metode  Naïve Bayes ini membantu membantu kita dalam menentukan probabilitas seorang pasien dengan gejala tertentu dapat dikatakan terkena Diabetes mellitus atau tidak terkena Diabetes mellitus berdasarkan dari 22 gejala sebagai indikator kunci dari Diabetes Mellitus. Dari masukan tersebut akan dibandingkan dengan data training yang telah tervalidasi.  Kata Kunci : Kunci : Diabetes mellitus, Teorema Bayes, Metode Naïve Bayes, Sistem Pakar

Abstract

The health sector is one area that has been implementing a variety of computer technologies. To make a diagnosis of the patient's illness was already done with the help of computers. One is to diagnose diabetes mellitus that can be happened to anyone. Diabetes mellitus is a disease that is oftenly found in the community. This disease is also the fourth largest cause of death in the world, and i n Indonesia, especially in big cities such as Jakarta and Surabaya which are nearly 10 percent of the population have diabetes. Therefore, this study aims to avoid t hese problems with the help of an expert system. In this case, the patient may enter a variety of symptoms that indicate Diabetes Mellitus disease. From that symptoms, it can be seen the predictions of patients that exposed or not exposed to Diabetes  Mellitus with the Naive Bayes method. Naive Bayes method helps us in determining the probability of a patient with certain symptoms that can be said exposed or not exposed based on 22 symptoms as a key indicator of Diabetes Mellitus. Furthermore, the input will be compared with training data that has been validated.  Keywords: Diabetes Diabetes Mellitus, Bayes Theorem, Theorem, Naive Bayes Methods, Methods, Expert System System

1

PENDAHULUAN

Teorema

Bayes

adalah

sebuah

 pendekatan untuk sebuah ketidaktentuan yang Diabetes

Mellitus

(DM)

adalah

diukur dengan probabilitas. Pendekatan bayes

 penyakit yang akhir-akhir ini semakin banyak

 pada

saat

klasifikasi

adalah

mencari

dijumpai. Penyakit Diabetes Melitus juga

 probabilitas tertinggi (VMAP) dengan masukan

sering kita sebut dengan istilah kencing manis

atribut (a1, a2, a3, ..., an) seperti tampak pada

atau penyakit gula darah. Penyakit yang satu

 persamaan 1 berikut [2] :

ini termasuk jenis penyakit kronis yang tanda VMAP = arg max P(v j |a1,a2,a3,...,an)

awalnya yaitu meningkatnya kadar gula dalam

(1)



v j V

darah sebagai akibat adanya gangguan sistem metabolisme dalam tubuh. Organ tubuh yang terganggu adalah pankreas yang mana sudah

Teorema Bayes sendiri berawal dari rumus

tidak

 persamaan 2 berikut :

berfungsi

sebagaimana

mestinya.

Pankreas sudah tidak mampu memproduksi hormon insulin dalam memenuhi kebutuhan

P(A|B) =

tubuh. Beberapa faktor yang menyebabkan

 

(2)

seseorang menderita penyakit diabetes, yaitu [3] :

Dimana

1) Banyak mengkonsumsi makanan yang

diketahui

P(A|B)

artinya

keadaan

B.

peluang

A jika

Kemudian

dari

 persamaan rumus 2 diatas didapat persamaan 3

mengandung gula

seperti berikut :

2) Kurang tidur 3) Makan terlalu banyak karbohidrat dari nasi

P(B

atau roti

 A) = P( B | A) P(A)

(3)

4) Merokok 5) Kurangnya Aktivitas Fisik

Sehingga didapatkan teorema bayes seperti

6) Faktor Keturunan

 persamaan 4 berikut :

Penentuan mengenai terkena penyakit Diabetes

P(A | B) =

Mellitus, dapat dikenali melalui beberapa

 |  

(4)

gejala yang dirasakan seperti banyak kencing, dehidrasi, berat badan turun, penglihatan

Yang mana :

kabur, dan sebagainya. Prediksi seseorang



A adalah hipotesis data A (class spesifik)

mengidap penyakit ini dapat diketahui dari



B adalah data dengan class yang belum

 perhitungan probabilitas menggunakan metode  Naïve

Bayes.

Metode

ini

diketahui

memanfaatkan

teorema Bayes.

2



P(A|B) adalah probabilitas hipotesis A

seperti banyak kencing, dehidrasi, berat badan

 berdasar

turun, penglihatan kabur, dan sebagainya.

kondisi

B

(posterior

|

Dalam prosesnya, diperlukan beberapa

 probability) 





P(B|A) adalah probabilitas B berdasar

tahapan untuk menjadikan data mentah sebagai

kondisi pada hipotesis A

knowledge based  bagi sistem pakar. Aktivitas

P(A) adalah probabilitas hipotesis A

yang dilakukan untuk memindahkan kepakaran

(prior probability)

adalah [3] :

P(B) adalah probabilitas dari B

1.  Knowledge Acquistion (dari pakar atau sumber lainnya)

Menggunakan teorema bayes ini, persamaan diatas dapat ditulis menjadi persamaan 5

2.  Knowledeg

Representation

(ke

dalam

komputer) 3.  Knowledge Inferencing 

 berikut ini :

4.  Knowledge Transfering  Vmap=arg max

 |  (5)

Akuisisi

pengetahun

dilakukan

sepanjang

 proses pembangunan sistem. Proses akuisisi  pengetahuan dibagi kedalam enam tahap, yaitu

Karena nilai P(a1, a2, a3, ..., an) konstan untuk semua v j, maka persamaan ini dapat ditulis

[5] : 1. Tahap Identifikasi Tahap identifikasi meliputi penentuan

menjadi persamaan 6 berikut ini :

komponen-komponen kunci dalam sistem yang sedang dibangun. Komponen kunci

VMAP = arg max P(a 1,a2,a3,...,an | v j)P(v j)

ini adalah knowledge



v j V

(6)

engineer , pakar, karakteristik masalah, sumber daya dan tujuan.

Untuk menghitung P(a1, a2, a3, ..., an | v j) bisa  jadi semakin sulit karena jumlah term P(a1, a2, a3, ..., an | v j) bisa jadi sangat besar [2]. Hal ini

Permasalahannya adalah bagaimana cara

Diabetes

bahwa

Mellitus

seseorang

dengan

Tahap ini, memperjelas konsep  –   konsep kunci

dan

hubungannya

yang

telah

didtemtukan pada tahap sebelumnya.

disebabkan jumlah term tersebut

memprediksikan

2. Tahap Konseptualisas

terkena

menggunakan

metode Naïve Bayes. Prediksi ini dapat menggunakan masukan berupa gejala  –   gejala Diabetes Mellitus yang dirasakan oleh pasien

3. Tahap Formalisasi Tahap ini, memetakan seluruh konsep  –  kosenp pengatahuan sebelumnya ke dalam representasi formal yang sesuai dengan  permasalahan. 4. Tahap Implementasi Pada tahap ini, hasil dari formalisasi diterapkan ke dalam skema representasi

3

 pengetahuan

yang

dipilih

kemudian

Perancangan Sistem

dibuatlah prototype dari sisem. 5. Tahap Pengujian

Prosedur perancangan sistem secara

Tahap ini, melakukan pengujian terhadap

umum terdiri atas beberapa tahap antara lain

sistem

 perancangan data, perancangan proses dan

dengan

memasukkan

berbagai

sampel masalah.

 perancangan interface.

6. Revisi Protoype

Tahap pertama adalah perancangan data meliputi data input, data output dan data

METODE PENELITIAN

training. Data training yang akan digunakan sebagai acuan untuk menentukan data output

Pada penelitian ini, metode yang

yang dihasilkan oleh sistem, diperoleh dari

digunakan adalah metode klasifikasi dengan

Departemen

kesehatan

 Naïve Bayes. Naïve Bayes menyederhanakan

sosial RI 2001 sebanyak 18 data [4]. Tahap

teorema bayes dengan asumsi bahwa fitur-fitur

kedua

dan

adalah

kesejahteraan

perancangan

tidak

 proses implementasi Naïve Bayes ke dalam

kata

sistem. Pada tahap ini akan dijelaskan cara

independen satu sama lain. Seperti tampak

kerja sistem (perhitungan) dan proses-proses

 pada persamaan 7 berikut ini :

yang akan digunakan,

yang

terdapat

tergantung

didalamnya

atau

saling

independen,

setiap

mulai dari masuknya

data input yang kemudian akan diproses oleh P(a1,a2,a3,...,an | v j) =

∏  |   

(7)

sistem hingga menjadi data output. Pada tahap ini diambil beberapa data

ini

training untuk di tes. Kemudian diambil

dengan persamaan diatas maka akan dihasilkan

 probabilitas kemunculan setiap nilai masing-

rumus seperti persamaan 8 berikut ini :

masing fitur per kelasnya.

Dengan

mensubstitusikan

persamaan

Langkah VMAP = arg max P(v j)



∏  |   

(8)

v j V

 Naïve Bayes adalah model penyederhanaan dari metode bayes. Dimana: 

VMAP = Nilai output hasil klasifikasi  Naïve Bayes



P(a1, a2, a3, …, an) = Peluang A



Vj = Keadaan atau kategori j

meng-generate

pertama data

adalah

training

yang

dengan telah

diperoleh sebanyak 18 dataset. Dari data training yang diperoleh, kemudian dilakukan analisa mengenai gejala (fitur) dari penyakit Diabetes

Mellitus.

Setelah

menganalisa,

didapatkan 22 indikasi (bersifat diskrit) dari Diabetes Mellitus, yaitu : a.

Polituria

 b. Polidipsia c.

Polipagia

d. Kesemutan e.

Rasa tebal

4

f.

Berat badan turun

Dari

kedua

fungsi

diatas,

dapat

g. Kulit

dilakukan perhitungan dengan metode Naïve

h. Gatal

Bayes seperti pada persamaan 9 berikut :

i.

Bisul

 j.

Infeksi

  ( )∏  |  

(9)

k. Keputihan l.

Luka

Dimana j adalah jumlah kelas dan i adalah

m. Lapar

 jumlah fitur yang ada.

n. Gemetar

Aturan

bayes

itu

sendiri

bisa

o. Lemah

ditetapkan sebagai berikut:

 p. Konsentrasi

Misalkan terdapat kategori dua kelas P(h 1) dan

q. Keringat

P(h2).

r.

Berdebar

| < |  , maka x diklasifikasikan

s.

Pusing

sebagai h2.

t.

Gelisah

Pada pengamatan nilai x tertentu,

u. Koma

ketika

mengambil

suatu

keputusan

maka

Serta dua kelas utama yaitu kelas Ya (terkena

 probabilitas errornya seperti pada persamaan

Diabetes Mellitus) dan kelas Tidak (tidak

10 berikut :

terkena Diabetes Mellitus). Langkah

kedua

yaitu

|  |  { | 

melakukan

testing dengan diberikan data sample. Dengan

(10)

 begitu dapat dihitung peluang terkena atau tidak terkena Diabetes Mellitus menggunakan  Naïve Bayes. Dalam proses perhitungannnya

Jadi jelasnya peluang error bisa diminimalkan

dibutuhkan Prior yang merupakan probabilitas

 jika diberikan nilai x dengan memutuskan h1

kemunculan kejadian tiap kelas yang tidak

 jika

diketahui dengan pasti tetapi dapat diestimasi

| > | dan memutuskan h  jika  | >  | [1]. Maka untuk

dari data yang tersedia. Prior dinyatakan

memutuskan

dengan (P(h j)).

memilih nilai posterior yang paling besar.

Variabel

random

diskrit

2

Tahap

yang

sesuatu

ketiga

Tahap

ini

atau

decide

adalah

dengan

perancangan

didistribusikan bergantung pada kemunculan

interface.

merupakan

tahap

objek dan dinyatakan dengan P(x|h) yang

 pembuatan user interface  sebagai fasilitator

menyatakan peluang muncul x jika diketahui h.

dalam berkomunikasi antar sistem dengan

Fungsi peluang P(x|h j) ini disebut juga dengan

user .

istilah fungsi likelihood dari h j terhadap x.

5

HASIL DAN PEMBAHASAN Eksperimen dilakukan untuk menguji kinerja sistem penentuan terkena Diabetes Mellitus. Pada proses pengujian ini, digunakan metode klasifikasi Naïve Bayes.

15

Gemetar

16

Lemah

17 Konsentrasi 18 Keringat

Langkah pertama yaitu menghitung  probabilitas kemunculan (gejala)

terhadap

dari

kelasnya.

setiap fitur Berdasarkan

19 Berdebar 20

Pusing

 perhitungan tersebut, diperoleh hasil seperti 21 Gelisah

 pada tabel 1 berikut :

Tabel 1. Likelihood tiap fitur dari semua kelas

Fitur 1

Poliuria

2

Polidipsia

3

Polipagia

4

Kram

5

Kesemutan

6

Rasa Tebal

7

Berat Badan Turun

8

Kulit

9

Gatal

10

Bisul

11

Infeksi

12 Keputihan 13

Luka

14

Lapar

Kondisi Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak

Diabetes Mellitus Ya Tidak 7/10 3/10 8/10 1/10 9/10 1/10 5/10 5/10 6/10 4/10 2/10 8/10 4/10 6/10 2/10 8/10 3/10 7/10 1/10 9/10 2/10 8/10 4/10 6/10 7/10 3/10 2/10 8/10

3/8 5/8 3/8 5/8 1/8 7/8 4/8 4/8 2/8 6/8 7/8 1/8 6/8 2/8 7/8 1/8 6/8 2/8 6/8 2/8 7/8 1/8 5/8 3/8 1/8 7/8 4/8 4/8

22

Koma

Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak

Kemudian

4/10 6/10 9/10 1/10 2/10 8/10 9/10 1/10 2/10 8/10 5/10 5/10 5/10 5/10 2/10 8/10

dilakukan

3/8 5/8 2/8 6/8 5/8 3/8 2/8 6/8 7/8 1/8 4/8 4/8 5/8 3/8 5/8 3/8 analisis

keakuratan data dengan memasukkan data sample melalui sistem seperti pada gambar 1 dan 2 berikut.

Gambar 1. Form input data user

Gambar 2. Form input gejala

6

Pengujian

keakuratan

dilakukan

dengan memasukkan masalah yang sama

Dari

pengujian

dapat

diketahui tingkat keakurasiannya adalah :

dengan data training sebelumnya. Dari hasil

    = 94,4% 

Akurasi =

 pengujian tersebut, dapat dihitung tingkat keakuratan dengan cara pada persamaan 11

tersebut,

KESIMPULAN

 berikut :

Pada penelitian ini dapat disimpulkan  bahwa semakin banyak jumlah data yang

      Akurasi =   

digunakan untuk training maka semakin tinggi (11)

Adapun hasil pengujian dari setiap data training ditunjukkan pada tabel 2 berikut :

keakuratannya. Selain itu, semakin sering juga dilakukan

learning

knowledge 

maka

akan

penambahan semakin

cepat

mendapatkan klasifikasi dengan benar. Untuk

Tabel 2. Hasil pengujian

atau

langkah

selanjutnya,

akan

 berkonsentrasi pada pengembangan aplikasi

Data

Data

Data Output

ke -

Training

(Hasil Pengujian)

1

ya

ya

mendapatkan akurasi yang tinggi dengan

2

ya

ya

 berapapun jumlah data trainingnya. Aplikasi

3

tidak

tidak

 juga

4

tidak

tidak

meminimalisir waktu pemrosesan pada saat

5

tidak

tidak

learning.

6

ya

ya

7

ya

ya

8

ya

ya

9

tidak

tidak

10

tidak

tidak

11

ya

ya

12

tidak

tidak

13

ya

ya

14

tidak

ya

15

ya

ya

16

ya

ya

17

ya

ya

18

tidak

tidak

seperti

dapat

konstanta

menentukan

bayes

dapat

secara

nilai

otomatis

disempurnakan

variasi untuk

untuk

DAFTAR PUSTAKA [1] Basuki, Achmad. 2006.  Metode Bayes. Pens,

Institut

Teknologi

Sepuluh

 November.

[2] Ferry Febrian, ” Analisis Komparasi Algoritma Klasifikasi Data Mining Pada Akseptasi

Data

Fakultatif

Reasuransi

Jiwa”, Tesis, Program Studi Teknik Informatika, Program Pasca Sarjana (S2) Magister

Komputer,

2011.

URL

:

http://edp.stmikpasim.ac.id/agoenthea/pub lic_html/thesis/Research%20Method/romi

7

-mp/01%20%20research%20fields/data%20mining/th esis/Ferry%20%20Komparasi%20Klasifikasi%20DM% 20untuk%20Akseptasi%20Reas.pdf  diakses tanggal 4 januari 2012.

[3] Suardin Yakub, “Sistem Pakar Deteksi Penyakit

Diabetes

Menggunakan

Mellitus

Dengan

Pendekatan

Naïve

Bayesian Berbasis Web”, Skripsi, Jurusan Teknik Informatika, Fakultas Sains Dan Teknologi, 2008. URL : http://lib.uinmalang.ac.id/thesis/fullchapter/04550034suardin-yakub.ps

diakses

tanggal

4

Oktober 2012.

[4] DEPKES RI. 2001. Pedoman

 Pengobatan Dasar Di Puskesmas  Berdasarkan Gejala. Jakarta : DEPKES.

[5]

Firebaugh  Intelligence:  Approach,

M.W., A

1989,

 Artificial

knowledge-Based

PWS-Kent

Publishing

Company, Boston.

8

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF