문제

나는 "감독되지 않은 분류"와 관련된 연구를하고 있습니다. 기본적으로 Trainset이 있으며 감독되지 않은 방식으로 X 수의 클래스로 데이터를 클러스터하고 싶습니다. 아이디어는 K- 평균과 비슷합니다.

의 말을하자

STEP1) FEACIESET는 [1057X10] 행렬이며 88 개의 클러스터로 클러스터링하고 싶습니다.

STEP2) 이전에 계산 된 클래스를 사용하여 TestData가 어떻게 분류되는지 계산합니다.

질문 -SVM 또는 NN으로 수행 할 수 있습니까? 다른 뭐야? -다른 권장 사항?

도움이 되었습니까?

해결책

많은 클러스터링 알고리즘이 있으며 웹에는 정보와 샘플 구현에 대한 정보가 부족합니다. 좋은 출발점은 클러스터 분석에 대한 위키 백과 항목입니다. cluster_analysis.

K-Means 구현이 작동하기 때문에 많은 변형 중 하나를 시도하여 더 나은 결과를 얻을 수 있는지 확인할 수 있습니다 (K- 평균 ++, 아마도 SVM을 언급 한 것처럼 볼 수 있음). 완전히 다른 접근 방식을 원한다면 자체 구성 기능 맵이라고도하는 Kohonen지도를 살펴보십시오. 그것이 너무 까다로워 보이면 간단한 계층 적 클러스터링을 구현하기가 쉽습니다 (가장 가까운 두 항목을 찾으십시오. 결합, 헹굼 및 반복).

다른 팁

이것은 클래식 클러스터링 문제처럼 들립니다. SVM이나 신경망은이 문제를 직접 해결할 수 없습니다. 두 가지 접근 방식을 사용할 수 있습니다 치수 감소, 예를 들어 10 차원 데이터를 2 차원 공간에 포함시키지 만 데이터를 클러스터에 넣지는 않습니다.

K-Means 외에 수많은 클러스터링 알고리즘이 있습니다. 대조적 인 접근 방식을 원한다면 시도하고 싶을 수도 있습니다. 응집 클러스터링 연산. 나는 당신이 어떤 종류의 컴퓨팅 환경을 사용하고 있는지 모르겠지만, 나는 아주 좋아합니다 아르 자형 그리고 클러스터링에 대한이 (매우) 짧은 가이드.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top