Cluster Non Hirarki

May 7, 2018 | Author: Aldila Sakinah Putri | Category: N/A

Short Description

UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA...

Description

BAB I PENDAHULUAN

1.1 Latar Belakang

Sektor industri menempati posisi sentral dalam ekonomi masyarakat modern dan merupakan motor penggerak yang memberikan dasar bagi peningkatan kemakmuran, terutama di negara-negara maju. Bagi negara berkembang, industri sangat esensial untuk memperluas landasan pembangunan dan memenuhi kebutuhan masyarakat yang terus meningkat. Banyak kebutuhan umat manusia hanya dapat dipenuhi oleh barang dan jasa yang disediakan dari sektor industri. Pembangunan Pembangunan di Indonesia khususnya khususnya pada sektor industri telah mengalami perkembangan yang cukup pesat. Perkembangan Perkembangan industri ini ternyata membawa dampak bagi kehidupan manusia, baik dampak positif maupun dampak negatif. Dampak positif dari kegiatan industri adalah dapat mengurangi mengurangi tingkat pengangguran, menambah devisa negara melalui ekspor produk industri, serta dapat menarik para investor untuk menanamkan menanamkan modal pada sektor ini. Selain dampak positif, kegiatan industri juga menimbulkan dampak negatif. negatif. Salah satu dampak negatif yang ditimbulkan adalah pencemaran udara. Pencemaran udara dirasakan semakin hari kian meningkat terutama daerah yang kepadatan lalu lintasny li ntasnyaa cukup tinggi serta di lokasi l okasi industri yang kurang memperhatikan dampak lingkungan. lingkungan. Udara yang tercemar dapat merusak lingkungan sekitarnya dan berpotensi terganggunya terganggunya kesehatan masyarakat sekitar. Dengan meningkatnya beban pencemaran udara sebagai efek negatif dari kegiatan industri, maka diperlukan pengelompokkan industri berdasarkan beban polutan yang dihasilkan untuk mengetahui tingkat pencemaran udara dari tiap jenis industri. Hal tersebut dimaksudkan agar pemerintah dan pelaku industri dapat merelokasikan zona industri, melakukan pemantauan kualitas udara pada tiap kelompok industri. Dalam analisis statistik, kriteria polutan tersebut dinyatakan sebagai variat. Semakin banyak unsur yang menjadi kriteria polutan akan semakin rumit analisis statistik yang harus dilakukan. Dari sekian banyak metode statistika, analisis multivariat merupakan analisis yang cocok untuk meringkas data dengan peubah yang banyak. Beberapa analisis dalam analisis

multivariat yang dapat digunakan untuk memahami dan mempermudah interpretasi data multivariat diantaranya adalah Analisis Cluster (Tim Penelitian dan Pengembangan, 2005:120). Analisis ini bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik diantara objek-objek tersebut. Dari analisis cluster kita dapat mengetahui kelompokkelompok yang terbentuk dengan ciri khas dari tiap kelompok. Banyak objek yang dapat dikelompokkkan dengan dengan analisis cluster, diantaranya diantaranya adalah produk (barang ( barang dan jasa), benda, manusia (responden, konsumen) (Supranto, 2004: 141). Analisis cluster dibagi dalam 2 metode, yaitu : 1. Metode Hierarchical 2. Metode Non - Hierarchical Dalam masalah ini akan dibahas mengenai analisis cluster dengan metode hierarchical dan metode non-hierarchical. Pada metode hierarchical ini memulai mengelompokkan mengelompokkan dengan dua atau lebih obyek yang mempunyai mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke obyek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam “pohon” hierarki (tingkatan) yang jelas antar obyek, dari yang paling mirip sampai yang paling tidak mirip. mir ip. Dendogram biasanya digunakan digunakan untuk membantu memperjelas proses hierarki tersebut.

1.2 Rumusan Masalah

Dalam uraian diatas maka dapat dibentuk rumusan masalah yaitu bagaimana melakukan pengelompokkan pengelompokkan data dengan menggunakan menggunakan metode clustering? 1.3 Tujuan

Dari rumusan masalah di atas maka tujuan dan maksud dari presentasi ini adalah sebagai berikut memberikan penjelasan bagaimana menggelompokkan menggelompokkan data dengan menggunakan menggunakan metode clustering.

BAB II KAJIAN TEORI

Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga sehingga setiap objek yang paling dekat kesamaannya kesamaannya dengan objek lain berada dalam cluster yang sama. Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen. Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk menghubungkan menghubungkan ataupun membedakan dengan sampel/variabel sampel/variabel lain. Analisis cluster merupakan salah satu alat analisis yang berguna sebagai sebagai peringkas data. Dalam meringkas data ini dapat dilakukan dengan jalan mengelompokkan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di antara objek-objek yang hendak diteliti. Analisis cluster merupakan alat untuk mengelompokkan mengelompokkan sejumlah n obyek berdasarkan p variat yang secara relatif mempunyai mempunyai kesamaan karakteristik diantara obyek – obyek – obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan, binatang dan orang (responden, konsumen, atau yang lainnya). Jika terdapat n obyek dan p variat, maka observasi x dengan i = 1, 2,…, n dan j = 1, 2, …, p, ij

dapat digambarkan sebagai berikut: Var 1

Var 2

…

Var j

…

Var p

x

x

…

x

…

x

x

…

x

…

x

:

:

:

:

:

x

:

x

:

x

:

:

:

:

:

:

x

:

x

Obyek 2

x

:

:

Obyek i

x

:

:

Obyek n

x

11

21

i1

n1

12

22

i2

x

n2

1j

2j

ij

nj

1p

2p

ip

np

Adapun ciri-ciri cluster adalah: 1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster ( within-cluster ). ). 2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya (between-cluster ). ). Analisis cluster mempunyai beberapa istilah penting, antara lain: 1. Skedul aglomerasi ( agalomeration schedule), ialah jadwal yang memberikan informasi tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses analisis cluster yang hierarkis. 2. Rata-rata cluster ( cluster centroid ), ), ialah nilai rata-rata variabel dari semua objek atau observasi observasi dalam cluster tertentu. 3. Pusat cluster ( cluster centers), ialah titik awal dimulainya pengelompokkan pengelompokkan di dalam cluster nonhierarki. 4. Keanggotaan cluster ( cluster membership), ialah keanggotaan keanggotaan yang menunjukkan cluster untuk setiap objek yang menjadi anggotanya. 5. Dendogram, disebut juga grafik pohon, output MINITAB yang memvisualisasikan hasil analisis cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk mana cluster digabung. Dendogram Dendogram harus dibaca dari kiri ke kanan. cl uster centers, ialah jarak 6. Distances between cluster j arak yang menunjukkan bagaimana

terpisahnya pasangan pasangan individu cluster Proses Analisis Cluster Untuk melakukan analisis cluster ada beberapa proses yang harus dilakukan . Proses analisis cluster tersebut meliputi : 1. Menentukan ukuran ketakmiripan antar dua objek. Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai kemiripan, maka proses pertama adalah mengukur seberapa jauh ada kesamaan antar objek. Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek tertentu lebih mirip dibandingkan dengan obyek lain, akan menghilangkan kebingungan kebingungan dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa menjadi ukuran ketakmiripan adalah fungsi jarak antara objek a dan b, yang biasa dinotasikan dengan d(a,b).

Sifat – Sifat – sifat sifat ukuran ketakmiripan adalah : 1) d(a.b) ≥ 0 2) d(a,a) = 0 3) d(a,b) = d(b,a) 4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b. 5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, (Sart ono, 2003:216). Jarak yang paling umum digunakan adalah jarak euclidean. Ukuran jarak atau ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d . Nilai d ih

diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut

 )

ih

 (     ∑



dimana: d = jarak kuadrat Euclidean antar obyek ke-i dengan obyek ke-h. ih

p = jumlah variabel cluster. x = nilai atau data dari obyek ke-i pada variabel ke-j. ij

x = nilai atau data dari obyek ke-h pada variabel ke-j hj

2. Membuat Cluster Proses cluster atau pengelompokan pengelompokan data bisa dilakukan dengan dua metode yaitu; a. Metode Hirarki Metode ini memulai pengelompokan pengelompokan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat. Kemudiaan operasi diteruskan ke objek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga cluste r akan membentuk semacam „pohon‟ dimana ada hirarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai paling tidak mirip. Metode yang digunakan untuk proses Clustering secara hirarki adalah Single Linkage (Pauatan Tunggal). Metode ini akan mengelompokan dua objek yang mempunyai mempunyai

jarak terdekat dahulu. dahulu. Jadi pada setiap setiap tahapan, banyakny banyaknyaa cluster berkurang satu. satu. Secara formal, dua buah cluster B dan B , jarak antara B dan B misalkan h(B ,B ) didefinisikan r

s

r

s

r

s

sebagai : h(B ,B ) = min{d(x ,x ); x anggota B , x anggota B } r

s

i j

i

r

j

s

Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu dendogram atau diagram pohon. Cabang-cabang Cabang-cabang pohon menunjukkan cluster/kelompok. Cabang-cabang tersebut bertemu bersama-sama (menggabung) pada simpul yang posisinya posisinya sepanjang suatu sumbu jarak (kemiripan) menunjukkan tingkat tingkat dimana penggabungan penggabungan terjadi.

b. Metode Non-hirarki Metode ini dimulai dengan proses penentuan jumlah cluster t erlebih dahulu. Metode Non-hirarki bertujuan mengelompokkan n obyek kedalam k kelompok 

  metode ini

yang digunakan adalah k-means. Metode k-means digunakan sebagai alternatif metode cluster untuk data dengan ukuran yang besar karena memiliki kecepatan yang lebih ti nggi dibandingkan metode hirarki. Mac Queen menyarankan bahwa penggunaan k-means untuk menjelaskan algoritma dalam penentuan suatu objek ke dalam cluster tertentu berdasarkan rataan terdekat. Proses Pengelusteran dengan metode k-means adalah : 1) Menetukan besarnya k, yaitu banyaknya banyaknya cluter dan menentukan centroid di tiap cluster. 2) Menghitung jarak tiap objek dengan setiap centroid . 3) Menghitung kembali rataan ( centroid ) untuk cluster yang baru terbentuk. 4) Mengulangi langkah 2 sampai tidak ada lagi pemindahan objek antar cluster 5) Setelah cluster terbentuk, baik dengan metode hirarki maupun non hirarki, langkah selanjutnya melakukan interpretasi terhadap cluster yang terbentuk,yang pada intinya memberi nama spesifik untuk menggambar isi cluster tersebut. 6) Melakukan validasi cluster. Untuk menguji validasi cluster digunakan uji parsial F. Hipotesis: H : variabel i bukan variabel pembeda dalam pengclusteran. pengclusteran. 0

H : variabel i merupakan variabel pembeda dalam pengclusteran pengclusteran 1

Taraf signifikansi α Statistik uji F =

     

Kriteria Uji : Tolak H jika F > F 0

-1,n-k α, k -1,n-k

BAB III PEMBAHASAN

3.1 Metode Hierarki

Berdasarkan data BPS (Badan Pusat Statistik) Semarang yaitu data tentang beban pencemaran udara menurut industry di Jawa Tengah tahun 2005. Data yang diunakan dalam permasalahan ini ada 5 variabel, dimana variable-variabel tersebut adalah jenis polutan yang meliputi debu, Sulfur dioksida (SO 2), Hidrocarbon (HC), dan Carbonmonoksida (CO). Sedangkan obyek-obyek obyek-obyek yang digunakan adalah 14 jenis Industri di Jawa Tengah yaitu Industri makanan, minuman, minuman, tekstil, kayu, kayu, olahan kayu, kertas, kimia dasar, dasar, non logam, semen, kapur dan gips, logam dasar, hasil-hasil olahan logam, rumah sakit, dan industry perhotelan. Dalam contoh ini akan digunakan proses clustering secra hirarki menggunakan metode pautan tunggal atau single lingkage metode ini didasarkan didasarkan pada jarak minimum. Tabel. 1 Data Beban Pencemaran Udara pada Sektor Se ktor Industri Di Jawa Tengah Tahun 2005 (dalam ton)

Industri

debu

SO2

NO2

HC

CO

makanan

16941.8

157563

73638.52

3168.8

393.13

Minuman

14608.3

135861

62496.05

2732.1

338.94

Tekstil

92737.1

862476

403086.58 17343.7

2151.66

Kayu

37078.6

344839

161163.97 8876.5

860.28

Olahan kayu

63789.9

575982

269190.49

11582.5

1436.93

Kertas

4916.8

483239

2137.91

919.5

131.40

Kimia dasar

6031.1

56090

27387.22

1127.9

139.93

non ogam

5226.6

48609

22717.69

977.5

121.27

Semen

509.7

4741

2215.52

95.3

11.83

Kapur dan Gips

9945.9

19350

10694.06

1860.1

230.75

Logam dasar

3830.5

35624

21977.07

1002.9

88.87

Hasil Olahan Logam

7291.3

67810

31691.85

1363.6

168.34

Rumah sakit

63.4

59

284.02

11.9

1.47

Perhotelan

98.2

91

426,64

18.4

2.28

Dalam melakukan analisis cluster terdapat dua metode yaitu metode kelompok hiraki dan metode kelompok non hirarki. Dalam hal ini metode yang digunakan adalah metode hiraki karena paling banyak digunakan oleh para peneliti dan memiliki keunggulan tersendiri, yaitu pengelompokan pengelompokan yang terbentuk dapat terjadi secara alamiah. alamiah. Kita menyelesaikan permasalahan ini menggunakan minitab, berikut langkah-langkahnya: langkah-langkahnya: – Cluster 1. Stat – Stat – Multivariat Multivariat – Cluster Observation 2. Variable of distance matrik(masukan seluruh variable yang diteliti 3. Lingkage method (dalam pembahsan ini meggunakn single) 4. Number of cluster (pilih 1) 5. Centang standardize variable 6. Centang 7. Show dendogram 8. Klik ok

Berdasarkan hasil pengolahan menggunakan Minitab didapatkan Hasil sebagai berikut: Cluster Analysis of Observations: debu, CO, SO2, HC Standardized Variables, Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of

Similarity

Distance

Clusters

New

in new

Step

clusters

level

level

cluster

cluster

1

13

99.9671

0.00219

13

14

13

2

2

12

99.5318

0.03118

9

13

9

3

3

11

99.1321

0.05778

7

8

7

2

4

10

98.6922

0.08707

7

11

7

3

5

9

98.6503

0.08987

7

12

7

4

6

8

97.4813

0.16770

1

2

1

2

7

7

96.2898

0.24703

7

10

7

5

8

6

95.9428

0.27014

7

9

7

8

9

5

92.1049

0.52567

1

7

1

10

10

4

78.5689

1.42693

1

6

1

11

11

3

75.0155

1.66353

1

4

1

12

12

2

74.9141

1.67028

1

5

1

13

13

1

67.2651

2.17957

1

3

1

14

joined

Final Partition Number of clusters: 1

Cluster1

Within

Average

Maximum

cluster

distance

distance

Number of

sum of

from

from

observations

squares

centroid

centroid

14

52

1.48746

5.25638

Dendrogram Single Linkage, Euclidean Distance 67.27

y 78.18 t i r a l i m i S

89.09

100.00 1

2

7

8

11

12 10 9 13 Observations

14

6

4

5

3

Keterangan 

Pada Step (tahap) 1, terbentuk satu cluster cl uster antara industri Rumah Sakit dan Industri

Perhotelan dengan dengan koofisien koofisien jarak 0.00219 0.00219 yang menunjukkan besarnya besarnya jarak antara industri industri Rumah sakit (13) dan Industri Perhotelan (14). Proses Aglomerasi dimulai dengan jarak antar obyek yang paling dekat. Pada step (tahap) 2,dapat dilihat terbentuknya cluster antara industri Semen (9) dan Industri Rumah sakit (13), dengan nilai koofisien jarak sebesar 0.03118 yang menunjukkan menunjukkan besarnya jarak terdekat antara industry semen dan kedua industry sebelumnya (industry Rumah sakit dan Perhotelan). Dengan terbentuknya cluster tersebut, maka sekarang cluster terdiri dari 3 obyek, yaitu industry rumah sakit, perhotelan dan juga industry semen. 

Pada Step (tahap)3, dapat dilihat dilihat terbentuknya cluster cluster antara industry Kimia dasar

dan industri non logam, dengan niai koefisien jarak j arak 0.05778 yang menunjukkan jarak terdekat antara industry Kimia dasar dan industry non logam. Terbentuk cluster baru dengan anggota industry kimia dasar dan industry non logam. 

Pada step 4, dapat dilihat terbentuk cluster antara industry kimia kimia dasar da sar dan industry

hasil olahan logam, dengan koefisien jarak 0.08707 yang menunjukkan jarak terdekat antara industry hasil olahan logam dengan dua industry sebelumnya (industry kimia dasar dan industry non logam). Dengan terbentuknya cluster tersebut, maka cluster sekarang terdiri dari 3 obyek yaitu industry kimia dasar, industry i ndustry non logam dan industry hasil olahan logam.

Pada step 7, didapatkan bahwa cluster antara industry kimia dasar, kapur dan gips,



logam dasar, dan industry hasil olahan logam dengan dan industry semen, rumah sakit dan industry perhotelan dengan nilai koofisien jarak 0.24703 . Dengan terbentuknya terbentuknya cluster tersebut, maka sekarang cluster terdiri dari 7 obyek, yaitu industry rumah sakit, perhotelan , industry semen , industry kimia dasar, kapur dan gips, logam dasar, dan industry hasil olahan logam. 

Dengan cara yang sama proses pengclusteran dilakukan terus menerus sampai step

terakhir yaitu step 13 hingga pada akhirnya hanya hanya membentuk sebuah cluster saja. Lebih jelasnya proses proses penggabungan penggabungan satu demi satu satu dapat dilihat dalam dalam bentuk dendogram dendogram diatas. Interpretasi Hasil: 1. Hasil analisis cluster dari 14 jenis industry berdasarkan jenis polutan (debu, SO 2, NO2, HC, CO) dapat dikelompokan menjadi 3 kelompok atau cluster, yaitu a.

cluster pertama adalah kelompok indutri pencemaran kecil

b. Cluster kedua adalah kelompok industry pencemaran sedang c. Cluster ketiga adalah kelompok industry pencemaran tinggi 2. Ciri-ciri tiap Cluster atau kelompok yaitu : a. Cluster pertama : kelima jenis j enis polutannya polutannya memiliki rata-rata kecil diantara cluster yang lain anggotanya yaitu industry logam dasar, industry kapur dan gips, industry semen, industry non logam, industry kimia dasar, industry minuman, industry makanan, industry hasil hasil olahan logam, industry rumah sakit, dan industry prhotelan. b. Cluster kedua : kelima jenis polutannya memiliki rata-rata lebih dari cluster pertama dan kurang dari cluster ketiga, anggotanya yaitu indutri kayu, industry olahan kayu, dan industry kertas. c. Cluster jetiga : kelima jenis polutannya memiliki rata-rata tebesar diantara cluster yang lain, anggotanya yaitu industry tekstil.

3.2 Metode Non Hierarki

Sebagaimana telah dijelaskan sebelumnya sebelumnya bahwa metode m etode K-Means Cluster ini jumlah cluster ditentukan sendiri. Metode non-hirarki memproses semua objek (kasus) secara sekaligus. Metode yang digunakan adalah k-means dimana k adalah banyaknya banyaknya cluster Proses pengclusteran dengan metode k-means adalah :

 .

a.

Besarnya k (banyaknya (banyaknya cluster) = 3. Centroid ada 3 karena jumlah cluster ada tiga. Nilai centroid diperoleh secara acak.

 (centroid cluster ) adalah nilai kelima variabel dari obyek industri kertas  (centroid cluster ) adalah nilai kelima variabel dari obyek industri rumah sakit  (centroid cluster ) adalah nilai kelima variabel dari obyek industri tekstil Nilai centroid dari tiap cluster adalah : c = (4916,75; 483238,54; 21370,91; 919,53; 131,4) 1

c = (63,37; 58,93; 284,02, 11,85; 1,47) 2

c = (92737,12; 862476,34; 403086,58 403086,58;; 17343,74; 17343,74; 2151,66) 3

b. Jarak setiap objek dengan tiap centroid Jarak setiap objek dari centroid ( pusat cluster) pertama dengan menggunakan menggunakan kuadrat jarak Euclidean adalah ; Tabel 2.1 Jarak setiap objek dari pusat cluster pertama c

Industri Makanan

1

2

2

2

2

(16941,83-4916,75) + (157562,87-483238,54) + (73638,52-21370,91) + (3168,79-919,53) + (393,132

11

131,40) = 1,089x10

Minuman

(14608,25-4916,75) + (135861,10-483238,54) + (62496,05-21370,91) + (2732,06-919,53) + (338,942

11

131,40) = 1,225x10

Tekstil

(92737,12-4916,75) + (862476,34-483238,54) + (403086,58-21370,91) + (17343,74 -919,53) + 2

11

(2151,66-131,40) =2,975x10

Kayu

2

2

2

2

(37078,59-4916,75) + (344839,36-483238,54) + (161163,97-21370,91) + (18876,55 -919,53) + 2

10

(860,28-131,40) = 4,005x10

Olahan kayu

(63789,95-4916,75) + (575981,54-483238,54) + (269190,49-21370,91) 2

10

+ (11582,55-919,53) +

(1436,93-131,40) =7,360x10

Kertas

(4916,75-4916,75) + (483238,54 -483238,54) + (21370,91-21370,91) + (919,53-919,53) + (131,402

131,40) = 0

Kimia dasar

2

2

2

2

(6031,05-4916,75) + (56090,16-483238,54) + (27387,22-21370,91) + (1127,93-919,53) + ( 139,932

11

131,40) = 1,825x10

Non logam

(5226,60-4916,75) + (48608,60 -483238,54) + (22717,69-21370,91) + (977,48-919,53) + (121,272

11

131,40) = 1,889x10

Semen

(509,72-4916,75) + (4740,50-483238,54) + (2215,52-21370,91) + (95,33-919,53) + (11,83-131,40) = 11

2,293x10

Kapur dan gips

( 9945,85-4916,75) + (19350,26-483238,54) + (10694,06-21370,91) + (1860,05-919,53) + (230,752

11

131,40) = 2,153x10

Logam Dasar

                                           

Hasil Olahan Logam

                                            

Rumah Sakit

                                       

Perhotelan

                                       

Jarak setiap objek dari centroid (pusat cluster) kedua dengan menggunakan menggunakan kuadrat jarak euclidean adalah; Tabel 2.2 Jarak setiap objek dari pusat cluster kedua c

Industri Makanan

2

(16941,83-63,37) + (157562,87-58,93) + (73638,52-284,02) + (3168,79-11,85) + (393,13-1,47) =3,048 x10

Minuman

10 2

2

2

2

2

(14608,25-63,37) + (135861,10-58,93) + (62496,05-284,02) + (2732,06-11,85) + (338,94-1,47) = 10

2,253 x10

Tekstil

(92737,12-63,37) + ( 862476,34-58,93) + (403086,58-284,02) + (17343,74 -11,85) + (2151,66-1,47) 11

=9,149 x10

Kayu

(37078,59-63,37) + (344839,36-58,93) + (161163,97-284,02) + (18876,55 -11,85) + (860,28-1,47) = 11

1,465 x10

Olahan kayu

2

= 4,082 x10

Kertas

2

2

2

2

(63789,95-63,37) + (575981,54-58,93) + (269190,49-284,02) + (11582,55-11,85) + (1436,93-1,47) 11

(4916,75-63,37) + (483238,54 -58,93) + (21370,91-284,02) + (919,53-11,85) + (131,40-1,47) = 11

2,339 x10

Kimia dasar

(6031,05-63,37) + (56090,16-58,93) + (27387,22-284,02) + (1127,93-11,85) + ( 139,93-1,47) = 9

3,911 x10

Non logam

2

2

2

2

2

(5226,60-63,37) + (48608,60-58,93) + (22717,69-284,02) + (977,48-11,85) + (121,27-1,47) = 2,888 9

x10

Semen

(509,72-63,3 (509,72-63,37) 7) +(4740,50-58 +(4740,50-58,93) ,93) + (2215,52-284,02) + (95,33-11,85) + (11,83-1,47) = 2,585x10

Kapur dan gips

(9945,85-63,37) + (19350,26-58,93) + (10694,06-284,02) + (1860,05-11,85) + (230,75-1,47) = 8

5,817x10

2

2

2

2

2

Logam Dasar

(3830,46-63,37) + (35624,19-58,93) + (21977,07-284,02) + (1002,93-11,85) + (88,87-1,47) = 1,751

Hasil Olahan Logam

x10 (7291,27-63,37)2 + (67810,42-58,93)2 + (31691,85-284,02)2 + (1363,61-11,85)2 + (168,34-1,47)2 =5,631 x109

Rumah Sakit

(63,37-63,37)2 + (58,93-58,93)2 + (284,02-284,02)2 + (11,85- 11,85)2 + (1,47-1,47)2 = 0

Perhotelan

(98,15-63,37)2 + ( 91,29-58,93)2 + ( 426,64-284,02)2 + ( 18,36-11,85)2 + (2,28-1,47)2 =2,264x104

9

Jarak setiap objek dari centroid (pusat cluster) ketiga dengan menggunakan kuadrat jarak euclidean adalah ;

Tabel 2.3 Jarak setiap objek dari pusat cluster ketiga c

Industri Makanan

3

2

2

2

(16941,83-92737,12) +(157562,87-862476,34) +(73638,52-403086,58) 2

+ (3168,79-17343,74)

11

2

+

(393,13-2151,66) = 6,114 x10

Minuman

2

2

2

2

(14608,25-92737,12) +(135861,10-862476,34) + (62496,05-403086,58) 2

+ (2732,06-17343,74) +

11

(338,94-2151,66) = 6,503 x10

Tekstil

2

2

2

2

(92737,12-92737,12) + (862476,34-862476,34) + (403086,58-403086,58) + (17343,74 -17343,74) 2

+ (2151,66-2151,66) = 0

Kayu

2

2

2

2

(37078,59-92737,12) + (344839,36-862476,34) + (161163,97-403086,58) + (18876,55-17343,74) + 2

11

(860,28-2151,66) = 3,296 x10

Olahan kayu

2

2

2

2

2

2

(63789,95-92737,12) + (575981,54-862476,34) + (269190,49-403086,58) + (11582,55-17343,74) + 2

11

(1436,93-2151,66) = 1,009 x10

Kertas

2

2

(4916,75-92737,12) + (483238,54-862476,34) + (21370,91-403086,58) + (919,53-17343,74) + 2

11

(131,40-2151,66) = 2,975 x10

Kimia dasar

2

2

2

2

(6031,05-92737,12) + (56090,16-862476,34) + (27387,22-403086,58) + (1127,93-17343,74) + ( 2

11

139,93-2151,66) = 7,992 x10

Non logam

2

2

2

2

(5226,60-92737,12) + (48608,60-862476,34) + (22717,69-403086,58) + (977,48-17343,74) + 2

11

(121,27-2151,66) = 8,150 x10

Semen

2

2

2

2

(509,72-92737,12) + (4740,50-862476,34) + (2215,52-403086,58) + (95,33-17343,74) + (11,832

11

2151,66) = 9,052 x10

Kapur dan gips

2

2

2

2

(9945,85-92737,12) + (19350,26-862476,34) + (10694,06-403086,58) + (1860,05-17343,74) + 2

11

(230,75-2151,66) = 8,719 x10

Logam Dasar

2

2

2

2

2

2

2

(3830,46-92737,12) + (35624,19-862476,34) + (21977,07-403086,58) + (1002,93-17343,74) + 2

11

(88,87-2151,66) = 8,371 x10 2

Hasil Olahan Logam

(7291,27-92737,12) + (67810,42-862476,34) + (31691,85-403086,58) + (1363,61-17343,74) +

Rumah Sakit

(63,37-92737,12)2 + (58,93-862476,34)2 + (284,02-403086,58)2 + (11,85-17343,74)2 + (1,472151,66)2 = 9,149 x1011

Perhotelan

(98,15-92737,12)2 +(91,29-862476,34)2 + (426,64-403086,58)2 + ( 18,36-17343,74)2 + (2,282151,66)2 =9,147 x1011

2

11

(168,34-2151,66) = 7,770 x10

Secara keseluruhan jarak tiap objek (industi) (industi) ke pusat cluster (centroid) adalah sebagai berikut; be rikut;

Tabel 2.4 Jarak tiap objek ke centroid secara keseluruhan Industri c c c 1

Makanan Minuman

2

11

1,089x10

11

1,225 x10

11

Tekstil

2,975 x10

Kayu

4,005 x10

Olahan kayu

7,360 x10

10 10

Kertas

0 11

Kimia dasar

1,825 x10

Non logam

1,889 x10

Semen

2,293 x10

Kapur&gips

2,153 x10

Logam dasar

2,004 x10

Hasil olahan logam Rumah sakit

1,727 x10

Perhotelan

2,339 x10

11 11 11 11 11

3,048x10

10

2,253 x10

11

6,114 x10

11

6,503 x10

11

0

9,149 x10

11

1,465 x10

11

4,082 x10

11

2,339x10

9

3,911 x10

9

2,888 x10

7

2,585x10

8

5,817x10

9

1,751x10

9

11

3,296 x10

11

1,009 x10

11

2,975 x10

11

7,992 x10

11

8,150 x10

11

9,052 x10

11

8,719 x10

11

8,371 x10

11

5,631x10

7,770 x10

0

9,149 x10

11

2,339 x10

11

3

10

4

2,264x10

11 11

9,147 x10

Dari tabel 2.4 diperoleh sebagai berikut; 

Jarak terdekat industri makanan adalah dengan c , sehingga industri makanan masuk ke



cluster 2. Jarak terdekat industri minuman adalah dengan c , sehingga industri minuman masuk ke



cluster 2. Jarak terdekat industri tekstil adalah dengan c , sehingga industri tekstil masuk ke cluster



3. Jarak terdekat industri kayu adalah dengan c , sehingga industri kayu masuk ke cluster 1.



Jarak terdekat industri olahan kayu adalah dengan c , sehingga industri olahan kayu



masuk ke cluster 1. Jarak terdekat industri kertas adalah dengan c , sehingga industri kertas masuk ke cluster



1. Jarak terdekat industri kimia dasar adalah dengan c , sehingga industri kimia dasar masuk



ke cluster 2. Jarak terdekat industri non logam adalah dengan c , sehingga industri non logam masuk



ke cluster 2. Jarak terdekat industri semen adalah dengan c , sehingga industri semen masuk ke cluster



2. Jarak terdekat industri kapur dan gips adalah dengan c , sehingga industri kapur dan gips

2

2

3

1

1

1

2

2

2

2

masuk ke cluster 2.



Jarak terdekat industri logam dasar adalah dengan c , sehingga industri logam dasar



masuk ke cluster 2. Jarak terdekat industri hasil olahan logam adalah dengan c , sehingga industri hasil



olahan logam masuk ke cluster 2. Jarak terdekat industri rumah sakit adalah dengan c , sehingga industri rumah sakit masuk



ke cluster 2. Jarak terdekat industri perhotelan adalah dengan c , sehingga industri perhotelan masuk

2

2

2

2

ke cluster 2.

Dari proses ini diperoleh anggota tiap cluster sebagai berikut : 

Cluster 1 dengan anggota : industri kayu, industri i ndustri olahan kayu, industri kertas.



Cluster 2 dengan anggota : industri logam dasar, industri i ndustri kapur dan gips, industri semen, industri non logam, industri kimia dasar, industri i ndustri minuman, industri makanan, industri hasil olahan logam, industri rumah sakit, i ndustri perhotelan.



Cluster 3 dengan anggota : industri tekstil.

c. Selanjutnya menghitung kembali centroid yang baru yang merupakan r ataan kelima variabel pada tiap cluster. c * (centroid cluster 1) adalah nilai kelima variabel dari 3 objek yang masuk ke dalam 1

cluster 1 pada langkah b. c * (centroid cluster 2) adalah nilai rata-rata kelima variabel dari 10 objek yang 2

masuk ke cluster 2 pada langkah b. c * (centroid cluster 3) adalah nilai rata-rata kelima variabel dari objek industri tekstil. 3

Nilai centroid dari tiap cluster adalah : c * = (35261,76; 468019,81; 150575,12; 10459,54; 809,54) 1

c * = (6454,66; 52579,83; 25352,86; 1235,84; 149,68) 2

c * = (92737,12; 862476,34; 403086,58; 17343,74; 2151,66) 3

d.

Jarak setiap objek dengan tiap centroid Jarak setiap objek dengan centroid (pusat cluster) pertama adalah sebagai berikut :

Tabel 2.5 Industri Makanan

c* 1

(16941,83-352 (16941,83-35261,76 61,76)) +(157562,87 +(157562,87-468019 -468019,81) ,81) + (73638,52-150 (73638,52-150575, 575,12) 12) + (3168,79-10459,54) + 2

11

(393,13-809,54) = 1,027x10

Minuman

(14608,25-352 (14608,25-35261,76 61,76)) +(135861,10 +(135861,10-468019 -468019,81) ,81) + (62496,05-150 (62496,05-150575, 575,12) 12) + (2732,06-10459,54) + 2

11

(338,94-809,54) = 1,186 x10

Tekstil

2

2

2

2

(92737,12-35261,76) +(862476,34-468019,81) +(403086,58-150575,12) + (17343,74 -10459,54) 2

11

+ (2151,66-809,54) = 2,227 x10

Kayu

(37078,59-352 (37078,59-35261,76 61,76)) +(344839,36 +(344839,36-468019 -468019,81) ,81) +(161163 +(161163,97 ,97 -150575,12) -150575,12) + (18876,55 -10459,54) 2

10

+ (860,28-809,54) = 1,536x10

Olahan kayu

(63789,95-352 (63789,95-35261,76 61,76)) +(575981,54 +(575981,54-468019 -468019,81) ,81) +(269190 +(269190,49-150 ,49-150575,12 575,12)) + (11582,55-10 (11582,55-10459,54 459,54)) + 2

10

(1436,93-809,54) = 2,654 x10

Kertas

2

2

2

(131,40-809,54) = 1,794 x10

Kimia dasar

2

2

(4916,75-35261,76) +(483238,54-468019,81) + (21370,91-150575,12) + (919,53-10459,54) + 10

(6031,05-35261,76) + (56090,16-468019,81) + (27387,22-150575,12) + (1127,93-10459,54) + 2

11

(139,93-809,54) = 1,858 x10

Non logam

(5226,60-35261,76) + (48608,60-468019,81) + (22717,69-150575,12) + (977,48-10459,54) + 2

11

(121,27-809,54) = 1,932 x10

Semen

(509,72-35261,76) + (4740,50-468019,81) + (2215,52-150575,12) + (95,33-10459,54) + (11,832

11

809,54) = 2,380 x10

Kapur dan gips

( 9945,85-35261,76) + (19350,26-468019,81) + (10694,06-150575,12) + (1860,05-10459,54) + 2

(230,75-809,54) = 2,216 x10

11

Logam Dasar

(3830,46-35261,76)2 + (35624,19-468019,81)2 + (21977,07-150575,12)2 + (1002,93-10459,54)2 + (88,87-809,54)2 = 2,046 x1011

Hasil Olahan Logam

(7291,27-35261,76)2 + (67810,42-468019,81)2 + (31691,85-150575,12)2 + (1363,61-10459,54)2 + (168,34-809,54)2 = 1,752 x1011

Rumah Sakit

(63,37-35261,76)2 + (58,93-468019,81)2 + (284,02-150575,12)2 + (11,85-10459,54)2 + (1,47809,54)2 = 2,429 x1011

Perhotelan

(98,15-35261,76)2 + (91,29-468019,81)2 + (426,64-150575,12)2 + (18,36-10459,54)2 + (2,28809,54)2 = 2,428 x1011

Jarak setiap objek dengan centroid (pusat cluster) kedua adalah sebagai berikut :

Tabel 2.6 Industri Makanan

c* 2

(16941,83-6454,66) + (157562,87-52579,83) + (73638,52-25352,86) + (3168,79-1235,84) + 2

(393,13-149,68) = 1,347 x10

Minuman

2

2

2

2

(14608,25-6454,66) + (135861,10-52579,83) + (62496,05-25352,86) + (2732,06-1235,84) + 2

(338,94-149,68) = 8,384 x10

Tekstil

10

9

2

2

2

2

(92737,12-6454,66) + ( 862476,34-52579,83) + (403086,58-25352,86) + (17343,74 -1235,84) + 2

(2151,66-149,68) = 8,063 x10

11

Kayu

2

2

2

2

2

2

2

(37078,59-6454,66) + (344839,36-52579,83) + (161163,97-25352,86) + (18876,55 -1235,84) + 2

11

(860,28-149,68) = 1,051 x10

Olahan kayu

2

(63789,95-6454,66) + (575981,54-52579,83) + (269190,49-25352,86) + (11582,55-1235,84) + 2

(1436,93-149,68) = 3,368 x10

Kertas

2

2

2

2

(4916,75-6454,66) + (483238,54 -52579,83) + (21370,91-25352,86) + (919,53-1235,84) + 2

(131,40-149,68) = 1,855 x10

Kimia dasar

11

11

2

2

2

2

(6031,05-6454,66) + (56090,16-52579,83) + (27387,22-25352,86) + (1127,93-1235,84) + ( 2

7

139,93-149,68) = 1,665 x10

Non logam

2

(5226,60-6454,66) 2

2

(121,27-149,68) = 2,429 x10

Semen

2

+ (48608,60-52579,83)

+ (22717,69-25352,86)

7

2

2

2

+ (977,48-1235,84)

2

+

2

(509,72-6454,66) + (4740,50-52579,83) + (2215,52-25352,86) + (95,33-1235,84) + (11,832

9

149,68) = 2,861 x10

Kapur dan gips

2

(9945,85-6454,66)

2

2

(230,75-149,68) = 1,332 x10

Logam Dasar

2

+ (10694,06-25352,86) + (1860,05-1235,84) +

9

2

(3830,46-6454,66)

2

2

+ (35624,19-52579,83)

2

Hasil Olahan Logam

2

+ (19350,26-52579,83)

2

+ (21977,07-25352,86) + (1002,93-1235,84) +

8

(88,87-149,68) = 3,058 x10 (7291,27-6454,66)2 + (67810,42-52579,83)2 + (31691,85-25352,86)2 + (1363,61-1235,84)2 + (168,34-149,68)2 = 2,729 x108

Rumah Sakit

(63,37-6454,66)2 + (58,93-52579,83)2 + (284,02-25352,86)2 + (11,85-1235,84)2 + (1,47-149,68)2 = 3,429 x109

Perhotelan

(98,15-6454,66)2 + (91,29-52579,83)2 + (426,64-25352,86)2 + (18,36-1235,84)2 + (2,28-149,68)2 = 3,418 x109

Jarak setiap objek dengan centroid (pusat cluster) ketiga adalah sebagai berikut : Industri Makanan

c* 3

(16941,83-927 (16941,83-92737,12 37,12)) +(157562,87 +(157562,87-862476 -862476,34) ,34) +(73638,5 +(73638,52-4030 2-403086,58 86,58)) + (3168,79-17343,74) + 2

11

(393,13-2151,66) = 6,114 x10

Minuman

2

2

2

2

(14608,25-92737,12) +(135861,10-862476,34) +(62496,05-403086,58) + (2732,06-17343,74) + 2

11

(338,94-2151,66) = 6,503 x10

Tekstil

(92737,12-927 (92737,12-92737,12 37,12)) +(862476,34 +(862476,34-862476 -862476,34) ,34) + 2

2

(403086,58-40 (403086,58-403086 3086,58) ,58)

+

(17343,74

-

(161163,97-40 (161163,97-403086 3086,58) ,58)

+

(18876,55

-

17343,74) + (2151,66-2151,66) = 0

Kayu

(37078,59-927 (37078,59-92737,12 37,12)) +(344839,36 +(344839,36-862476 -862476,34) ,34) + 2

2

11

17343,74) + (860,28-2151,66) = 3,296 x10

Olahan kayu

2

2

2

2

(63789,95-92737,12) +(575981,54-862476,34) + (269190,49-403086,58) + (11582,55-17343,74) 2

11

+ (1436,93-2151,66) = 1,009 x10

Kertas

(4916,75-92737,12) + (483238,54 -862476,34) + (21370,91-403086,58) + (919,53-17343,74) + 2

11

(131,40-2151,66) = 2,975 x10

Kimia dasar

(6031,05-92737,12) + (56090,16-862476,34) + (27387,22-403086,58) + (1127,93-17343,74) + ( 2

11

139,93-2151,66) = 7,992 x10

Non logam

2

2

2

2

(5226,60-92737,12) + (48608,60 -862476,34) + (22717,69-403086,58) + (977,48-17343,74) + 2

11

(121,27-2151,66) = 8,150 x10

2

Semen

2

2

2

(509,72-92737,12) + (4740,50-862476,34) + (2215,52-403086,58) + (95,33-17343,74) + (11,832

11

2151,66) = 9,052 x10

Kapur dan gips

2

2

2

2

( 9945,85-92737,12) + (19350,26-862476,34) + (10694,06-403086,58) + (1860,05-17343,74) + 2

11

(230,75-2151,66) = 8,719 x10

Logam Dasar

(3830,46-92737,12) + (35624,19-862476,34) + (21977,07-403086,58) + (1002,93-17343,74) + 2

(88,87-2151,66) = 8,371 x10

Hasil Olahan Logam

11

(7291,27-92737,12) + (67810,42-862476,34) + (31691,85-403086,58) + (1363,61-17343,74) + 2

11

(168,34-2151,66) = 7,770 x10

Rumah Sakit

2

2

2

2

(63,37-92737,12) + (58,93-862476,34) + (284,02-403086,58) + (11,85-17343,74) + (1,472

11

2151,66) = 9,149 x10 2

Perhotelan

2

2

2

(98,15-92737,12) + (91,29-862476,34) + (426,64-403086,58) + (18,36-17343,74) + (2,282

11

149,68) = 9,147 x10

Secara keseluruhan jarak tiap objek (industri) (industri) ke pusat cluster (centroid) adalah sebagai berikut: Industri Makanan Minuman Tekstil

c*

c*

1

11

1,027 x10

11

1,186 x10

11

2,227 x10

1,536 x10

Olahan kayu

2,654 x10

Kertas

1,794 x10

11

1,858 x10

Semen

2,380 x10

Hasil olahan logam Rumah sakit Perhotelan

11 11 11

2,216 x10

11

2,046 x10

11

1,752 x10

11

2,429 x10

11

2,428 x10

11

6,114 x10

8,384 x10

11

6,503 x10

0

11

8,063 x10

11

1,051 x10

11

3,368 x10

1

1,932 x10

Logam dasar

1,347 x10

10

Non logam

Kapur&gips

3

1

1

Kayu

Kimia dasar

c*

2

11

1,855 x10

7

11

3,296 x10

11

1,009 x10

11

2,975 x10

11

1,665 x10

7,992 x10

2,429 x10

8,150 x10

2,861 x10

9,052 x10

1,332 x10

8,719 x10

3,058 x10

8,371 x10

8

11 11 11 11 11

2,729 x10

7,770 x10

3,429 x10

9,149 x10

3,418 x10

9,147 x10

11 11

Keterangan : 

Jarak terdekat industri makanan adalah dengan c , sehingga industri makanan 2

masuk ke cluster 2.



Jarak terdekat industri minuman adalah dengan c , sehingga industri minuman 2

masuk ke cluster 2.



Jarak terdekat industri tekstil adalah dengan c , sehingga industri tekstil masuk ke 3

cluster 3. 

Jarak terdekat industri kayu adalah dengan c , sehingga industri kayu masuk ke 1

cluster 1. 

Jarak terdekat industri olahan kayu adalah dengan c , sehingga industri olahan 1

kayu masuk ke cluster 1. 

Jarak terdekat industri kertas adalah dengan c , sehingga industri kertas masuk ke 1

cluster 1. 

Jarak terdekat industri kimia dasar adalah dengan c , sehingga industri kimia dasar 2

masuk ke cluster 2. 

Jarak terdekat industri non logam adalah dengan c , sehingga industri non logam 2

masuk ke cluster 2. 

Jarak terdekat industri semen adalah dengan c , sehingga industri semen masuk ke 2

cluster 2. 

Jarak terdekat industri kapur dan gips adalah dengan c , sehingga industri kapur 2

dan gips masuk ke cluster 2. 

Jarak terdekat industri logam dasar adalah dengan c , sehingga industri logam 2

dasar masuk ke cluster 2. 

Jarak terdekat industri hasil olahan logam adalah dengan c , sehingga industri 2

hasil olahan logam masuk ke cluster 2. 

Jarak terdekat industri rumah sakit adalah dengan c , sehingga industri rumah 2

sakit masuk ke cluster 2. 

Jarak terdekat industri perhotelan adalah dengan c , sehingga industri perhotelan 2

masuk ke cluster 2 Dari proses ini diperoleh anggota tiap cluster sebagai berikut :

Cluster 1 dengan anggota : industri kayu , industri olahan kayu, industri kertas. Cluster 2 dengan anggota : industri logam dasar, industri kapur dan gips, industri semen, industri non logam, industri kimia dasar, industri i ndustri minuman, industri makanan, industri hasil olahan logam, industri rumah sakit, i ndustri perhotelan. Cluster 3 dengan anggota anggota : industri tekstil. tekst il. Karena tidak ada perubahan hasil pengclusteran, pengclusteran, maka proses berhenti. Dari tiga cluster yang terbentuk, kita dapat melihat rata-rata banyaknya banyaknya polutan (dalam satuan ton) pada setiap cluster, yaitu :

•

Untuk polutan debu terbanyak berada di cluster ketiga keti ga dengan rata-rata sebesar 92.737,12 ton. Jadi industri tekstil menghasilkan polutan debu terbesar. Sedangkan Sedangkan polutan debu terkecil adalah dari cluster kedua dengan rata-rata sebesar 6.454,66 ton.

•

Untuk polutan SO terbanyak berada di cluster ketiga dengan rata-rata sebesar 2

862.476,34 ton. Sedangkan polutan SO terkecil adalah dari cluster kedua 2

dengan rata-rata sebesar 52.579,83 ton. •

Untuk polutan NO terbanyak berada di cluster ketiga dengan rata-rata sebesar 2

403.086,58 ton. Sedangkan polutan NO terkecil adalah dari cluster kedua dengan 2

rata-rata sebesar 25.352,86 ton.

•

Untuk polutan HC terbanyak berada di cluster ketiga dengan rata-rata sebesar 17.343,74 ton. Sedangkan polutan HC terkecil adalah dari cluster kedua dengan rata-rata sebesar 1.235,84 ton

•

Untuk polutan CO terbanyak berada di cluster ketiga dengan rata-rata sebesar 2.151,66 ton. Sedangkan polutan CO terkecil adalah dari cluster kedua dengan rata-rata sebesar 149,68 ton.

3. Setelah cluster terbentuk, tahap selanjutnya yaitu memberi nama spesifik untuk menggambarkan menggambarkan isi cluster cl uster tersebut. Dari ketiga cluster yang terbentuk kita dapat mengklasifikasikan sebagai sebagai berikut : Cluster pertama : Kelima jenis polutan memiliki rata-rata lebih dari cluster kedua dan kurang dari cluster ketiga, sehingga dapat kita golongkan golongkan menjadi kelompok industri dengan tingkat pencemaran sedang, anggotanya anggotanya adalah industri kayu , industri olahan kayu dan industri kertas.

Cluster kedua : Kelima jenis polutan memiliki rata -rata terkecil diantara cluster yang lain, sehingga dapat kita golongkan golongkan menjadi kelompok industri i ndustri dengan tingkat pencemaran rendah, anggotanya anggotanya adalah industri logam dasar, iindustri ndustri kapur dan gips, industri semen, industri non logam, industri kimia dasar, industri minuman, industri makanan, industri hasil olahan logam, industri rumah sakit dan industri perhotelan. Cluster ketiga : Kelima jenis polutan memiliki rata -rata terbesar diantara cluster yang lain, sehingga dapat kita golongkan menjadi kelompok industri dengan tingkat pencemaran tinggi, anggotanya anggotanya adalah industri tekstil.

BAB IV KESIMPULAN

4.1 Kesimpulan

Setelah mengelompokkan n buah obyek pengamatan kedalam m kelompok berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah untuk mendapatkan kelompok obyek obyek yang memiliki nilai relatif sama. Sehingga kelak dalam interpretasi, obyek-obyek yang berada pada satu cluster cl uster memiliki peluang yang cukup tinggi akan muncul bersamaan pada satu individu. Manfaat analsis Cluster 1. Untuk menerapkan dasar-dasar pengelompokan dengan lebih konsisten. 2. Untuk mengembangkan suatu metode generalisasi secara innduktif, yaitu pengambilan kesimpulan secara umum dengan dengan berdasarkan fakta-fakta f akta-fakta khusus. 3. Menemukan tipologi yang cocok dengan karakter obyek yang diteliti. 4. Mendiskripsikan sifat-sifat / karakteristik dari masing-masing kelompok. Metode pengelompokan pada dasarnya ada dua, yaitu pengelompokan hirarki (Hierarchical Clustering Method) dan pengelompokan non hirarki Non Hierarchical Clustering Method). Metode pengelompokan hirarki digunakan digunakan apabila belum ada informasi jumlah



kelompok. Sedangkan metode pengelompokan pengelompokan non hirarki bertujuan mengelompokan mengelompokan n obyek ke dalam k kelompok ( k < n ). Salah satu prosedur pengelompokan pada pada non hirarki adalah dengan menggunakan menggunakan metode K-Means. Metode ini merupakan metode pengelompokan pengelompokan yang bertujuan mengelompokan obyek obyek sedemikian hingga jarak tiap-tiap obyek ke pusat kelompok di dalam satu kelompok adalah minimum. 4.2 Saran

Terdapat beberapa algoritma cluster yang dapat digunakan untuk mengelompokkan objek-objek, baik itu dengan pengelompokan pengelompokan hirarki ataupun ata upun pengelompokan non hirarki. Namun yang perlu diperhatikan adalah stabilitas dari solusi yang diperoleh, oleh karena itu perlu di cek kembali setiap algoritma cluster tersebut baik sebelum atau sesudah pengelompokkan.

Cluster Non Hirarki

Short Description

Description

Comments

We need your help!