Unsupervised learning tidak membutuhkan data latih untuk melakukan prediksi maupun klasifikasi. Berikut merupakan perbandingan penulisan code beberapa algoritma unsupervised learning.
K-Mean
Metode ini bertujuan untuk melakukan clustering (pengelompokan objek) bukan klasifikasi (prediksi objek). Prinsip kerja metode ini mengelompokkan objek berdasarkan kedekatan dengan mean setiap cluster. Beberapa input yang diperlukan adalah
- x = data (dalam bentuk numerik)
- centers = banyak cluster yang akan dibentuk (misal 2)
## R Code df_scale <- scale(df) # Normalisasi Data k2 <- kmeans(x=df,centers = 2) win.graph() library(factoextra) fviz_cluster(k2,data=df) # plot hasil clustering # Summary k3$cluster # hasil pengelompokan k3$centers # nilai centroid k3$withinss # keragaman tiap cluster k3$tot.withinss # total keragaman seluruh cluster k3$betweenss #keragaman antar cluster
## Python Code from sklearn.cluster import KMeans k = KMeans(n_clusters=3) # number of cluster model = k.fit(df) # Running model label = model.predict(df) # hasil pengelompokan centroid = model.cluster_centers_ # nilai centroid df['Result'] = label # Menggabungkan data asli dan hasil clutering