Unsupervised Learning

Unsupervised learning tidak membutuhkan data latih untuk melakukan prediksi maupun klasifikasi. Berikut merupakan perbandingan penulisan code beberapa algoritma unsupervised learning.

K-Mean
Metode ini bertujuan untuk melakukan clustering (pengelompokan objek) bukan klasifikasi (prediksi objek). Prinsip kerja metode ini mengelompokkan objek berdasarkan kedekatan dengan mean setiap cluster. Beberapa input yang diperlukan adalah

  1. x = data (dalam bentuk numerik)
  2. centers = banyak cluster yang akan dibentuk (misal 2)
## R Code
df_scale <- scale(df) # Normalisasi Data
k2 <- kmeans(x=df,centers = 2) 
win.graph()
library(factoextra)
fviz_cluster(k2,data=df) # plot hasil clustering

# Summary
k3$cluster # hasil pengelompokan
k3$centers # nilai centroid
k3$withinss # keragaman tiap cluster
k3$tot.withinss # total keragaman seluruh cluster
k3$betweenss #keragaman antar cluster
## Python Code
from sklearn.cluster import KMeans

k = KMeans(n_clusters=3) # number of cluster
model = k.fit(df) # Running model
label = model.predict(df) # hasil pengelompokan
centroid = model.cluster_centers_ # nilai centroid
df['Result'] = label # Menggabungkan data asli dan hasil clutering