k-means2 비계층적 군집분석 (Non-hierachical Clustering) 비계층적 군집분석(Non-hierachical Clustering)은 주어진 데이터를 k개의 군집으로 나눈다. 원하는 군집의 수 k는 사전에 지정 (알고 있다고 가정) 한다. k-평균 군집화 알고리즘은 군집의 중심이 되는 k개의 seed(씨드) 점들을 선택하여 그 seed 점과 거리가 가까운 개체들을 그룹화하는 방법이다. 알고리즘은 다음과 같다. K개의 중심점을 임의로 배치한다. 모든 자료와 K개의 중심점과 거리를 계산하여 가장 가까운 중심점의 군집으로 할당한다. 군집의 중심을 구한다. (평균을 구한다.) 정지규칙에 이를 때까지 2~3단계를 반복한다. - 군집의 변화가 없을때 - 중심점의 이동이 임계값 이하일 때 - 왜곡값(distortion, 각각의 클러스터의 거리제곱의 총합) 줄어들었다가 다시 늘어나.. 2023. 4. 24. 군집 분석 (Clustering) 비지도 학습 (Unsupervised Learing)은 입력 데이터에 Label 없이 데이터의 특성만으로 패턴을 찾는 학습 방법이다. 대부분은 지도학습이다. 비지도 학습을 사용하는 이유는 다음과 같다. 알려지지 않은 모든 종류의 패턴을 찾으려는 시도 범주화에 도움되는 특징과 패턴을 알아내는데 도움이 됨 새로운 데이터에 대한 실시간으로 처리 가능 Label이 되지 않는 데이터가 더 확보하기 쉬움. 라벨링에 비용과 시간이 많이 든다. 비지도 학습의 종류에는 Clustering, Association Rule, Dimension Reduction 등이 있다. Clustering (군집분석)은 계층적 군집분석과 비계층적 군집분석이 있다. Clustering은 주어진 입력값(들)을 바탕으로 유사한 값들로 데이터를.. 2023. 4. 23. 이전 1 다음