- 군집화 - 군집화 알고리즘 K-means, Mean shift, Gaussian mixture model, DBSCAN 1. K-means Clustering 군집 중심점(Centroid) 기반 클러스트링 각 데이터들은 가장 가까운 중심점에 소속된다. 중심점이 각 소속 데이터들의 평균으로 이동한다. 다시, 각 데이터들은 이동된 중심점 기준으로 가장 가까운 중심점에 소속 중심점을 이동했지만 중심점 소속 변경이 없으면 군집화 완료 장점: 일반적인 군집화에서 가장 많이 활용됨, 대용량 데이터에도 활용 단점: 거리기반 알고리즘이어셔, 속성의 개수가 많으면 정확도 떨어짐 이상치 데이터에 취약 - 사이킷런 KMeans 클래스 - 군집 평가: 실루엣 분석 각 군집간 거리가 얼마나 효율적으로 분리돼 있는가? 개별 ..