Saturday, March 31, 2012

Analisis Penentuan jumlah Cluster - K-Means Clustering


Analisis Penentuan jumlah Cluster

Jumlah cluster yang kami gunakan pada praktikum kali ini ialah 3 dan 4 yang kemudian diperoleh cluster yang baik untuk mengelompokan pegawai ialah cluster . Efek dari penentuan jumlah cluster ini akan terlihat setelah dilakukan perhitungan melalui metode K-Means Clustering. Begitupun alasan pemilihan jumlah cluster yang diambil dapat terlihat setelah melakukan perhitungan ini. Setelah dilakukan perhitungan dapat dilihat kekurangan dan kelebihan secara teknis dari banyaknya cluster yang digunakan. Berkut adalah beberapa alasanpemilihan jumlah cluster :
1.       Sum Squared Error (SSE) lebih kecil
Jumlah Cluster 3
SSE
14.38905984
Jumlah Cluster 4
SSE
12.51748067

SSE (Sum Squared Error) dari setiap cluster dapat menjadi ukuran performansi baik/tidaknya cluster tersebut. Dari dua jumlah cluster yang telah dicoba, dapat diketahui bahwa SSE dari jumlah cluster 4 lebih kecil dibandingkan dengan jumlah cluster 3. Ini menunjukan entitas yang masuk pada jumlah cluster 4 memiliki kesamaan yang lebih seragam dari pada entitas yang ada pada jumlah cluster 3.

2.       Nilai BCV/WCV lebih besar
Selain itu, performansi suatu cluster juga dilihat dari nilai rasio BCV/WCV. Dari dua jumlah cluster yang telah dicoba, dapat diketahui bahwa nilai BCV/WCV untuk jumlah cluster 4 lebih besar dari BCV/WCV untuk jumlah cluster 3. Berikut ini adalah perbandingan nilai BCV dan WCV untuk kedua jumlah clustertersebut.
Jumlah Cluster 3
BCV/WCV
0.159610427
Jumlah Cluster 4
BCV/WCV
0.399295681

Rasio ini menunjukan error within antar data pada masing-masing cluster. Jika SSE kecil menunjukan kemiripan didalam entitas cluster semakin mirip dan seragam dan jika BCV besar menunjukan variansi keberbedaan antar cluster yang satu dengan yang lainnya semakin besar dan jauh berbeda.

3.       Efektifitas dan Efisiensi Penentuan Treatment
Pemilihan jumlah cluster akan sangat berkaitan dengan pemberian treatment yang ditentukan oleh perusahaan. Pemberian treatment yang berbeda dalam jumlah cluster yang banyak akan membuat biaya semakin besar, tetapi jika clustersedikit dan treatment yang diberikan sedikit maka efektivitas treatmentmenjadi kurang signifikan. Untuk itu pemilihan jumlah cluster harus benar-benar disesuaikan dengan kebutuhan perusahaan. Jumlah cluster sebanyak 4dianggap sudah cukup dapat mewakili jumlah treatmentyang lebih memadai dan lebih efektif dibanding jumlah cluster 3. Namun, apabila jumlah cluster lebih banyak dari 4 dianggap tidak efisien oleh perusahaan sedangkan alokasi dana untuk pelaksanaan treatment sangat terbatas.

0 Reactions to this post

Add Comment

    Post a Comment