본문 바로가기

kmeans2

[머신러닝] 클러스터링 평가지표 - 실루엣 계수(2) 이전 포스팅에서 실루엣 계수를 구하는 방법과 평가지표로써의 장단점을 알아보았다. 2021.06.15 - [머신러닝] - [머신러닝] 클러스터링 평가지표 - 실루엣 계수 (1) [머신러닝] 클러스터링 평가지표 - 실루엣 계수 (1) 실루엣 계수(Silhouette Coefficient) : 각 데이터 포인트와 주위 데이터 포인트들과의 거리 계산을 통해 값을 구하며, 군집 안에 있는 데이터들은 잘 모여있는지, 군집끼리는 서로 잘 구분되는지 클러 studying-haeung.tistory.com 이 시간에는 Python 코드로 실루엣 계수를 시각화해보고, 그 의미에 대해서 알아볼 것이다. 0. Yellowbrick 라이브러리 실루엣 계수 시각화를 위해 Yellowbrick이라는 python 라이브러리를 활용하.. 2021. 7. 21.

[머신러닝] K-Means 군집화 K-Means 알고리즘 : 데이터 포인트들을 비슷한 속성의 그룹으로 묶어주는 비지도학습 알고리즘 중 하나이다. 'Centroid'라는 클러스터(군집)의 중심점 개념이 사용된다. 데이터 포인트들과 Centroid들 간 거리 계산을 통해 Centroid들의 위치가 재설정되며 학습이 진행된다. 이 시간에는 K-Means 알고리즘 수행 단계를 간단히 정리해보고자 한다. K-Means 알고리즘 수행 단계 '초기화', '학습', '새로운 데이터에 적용' 이렇게 크게 3단계로 구분할 수 있다. 1. 초기화 사용자가 처음 정하는 아래 2개 항목은 알고리즘 수행 결과에 큰 영향을 미친다. 클러스터 개수 : 최종적으로 만들고자 하는 클러스터의 개수를 정해준다. 클러스터 중심점(Centroid) 위치 설정 방법 : 중심점의.. 2021. 5. 30.

이전 1 다음

티스토리툴바