필리 인근에서 점 목록

https://stackoverflow.com/questions/416406

03-07-2019
|

문제

나 반 응답에 대한 질문을 찾는 클러스터의 질량 비트맵.말 반 응답했기 때문에 나는 그것을 떠난 상태에서 어디서 나는 모든 지점에서 비트맵으로 정렬 질량과 왼쪽 그것은 독자에게 목록을 필터링 제거한 포인트에서 동일한 클러스터입니다.

그런 다음에 대해 생각할 때는 단계 I 을 발견하는 솔루션을 하지 않았 밖으로 뛰어 나처럼 생각했습니다.그래서 이제 나는 너희들을 위해 도움이됩니다.우리는 점의 목록과 함께 대중과 같은 정도(Python 목록의 튜플을,하지만 당신은 나타낼 수 있으로 그것을 당신이 볼에 맞게 어떤 언어):

[ (6, 2, 6.1580555555555554),
  (2, 1, 5.4861111111111107),
  (1, 1, 4.6736111111111107),
  (1, 4, 4.5938888888888885),
  (2, 0, 4.54),
  (1, 5, 4.4480555555555554),
  (4, 7, 4.4480555555555554),
  (5, 7, 4.4059637188208614),
  (4, 8, 4.3659637188208613),
  (1, 0, 4.3611111111111107),
  (5, 8, 4.3342191043083904),
  (5, 2, 4.119574829931973),
  ...
  (8, 8, 0.27611111111111108),
  (0, 8, 0.24138888888888888) ]

각 행의 형태로 되어 있습니다.

(x, y, mass)

참고로 목록을 정렬 여기에.는 경우에 당신의 솔루션을 선호하지 않는 그들이 그것을 완벽하게 확인.

도전 당신이 기억하는 경우, 을 찾을 수 있습니다 주요 클러스터의 질량.클러스터의 수를 알 수 없습니다.하지만 알다시피 차원의 bitmap.때때로 여러 지점에서 클러스터의 더 많은 대량의 중심보다 다음(크기)클러스터입니다.그래서 내가 원하는 것은 위에서 대량 포인트 제거 점에서 동일한 클러스터(포인트 인근).

려고 할 때 이 나에는 도보를 통해 부품의 목록니다.나는 느낌이 나는 그냥 바보니다.어떻게 그렇게 하겠소?의사 코드 또는 실제 코드입니다.물론할 수 있는 경우,다만 내가 왼쪽에서 그 답이 쉽게 나를 위해 실험을습니다.

다음 단계는 그는 얼마나 많은 클러스터는 정말 거기에서 bitmap.나는 여전히 어려움을 겪고로 정의하는 문제 그래서 나는 반환할 수 있습니다 질문에 대한니다.

편집: 난 명확하게 알고 있는 것이 없다"올바른"이 질문에 대답.는 이름의 질문의 핵심입니다.단계 하나의 제 클러스터링이 수행됩니다. Im 에서 검색을 빠르고,정확한"충분히"방법의 필터링하리 근처의 포인트입니다.

알려주는 경우에 당신이 볼 수있는 방법들에게 질문을 명확하다.

해결책

너도 알다시피 질문에 대한 솔루션 병-인 문제:더 확실한 솔루션이 존재합니다.는...그것은 그냥 재미를 더합니다.귀하의 문제가 아픈 제기하는 대부분을 모르기 때문에 얼마나 많은 클러스터의 당신이 원하는.클러스터링을 하나의 핵심 영역에 대해 기계 학습하고 있는 꽤 몇 가지 접근 방식이 개발되었습니다.

로 거미 지적, k-means 알고리즘 경향이나 그것은 매우 쉽게 구현할 수 있습니다.결과로 의존에서 처음 만들어 추측하고의 수에 원하는 클러스터입니다.을 극복하는 초기 생각,그것은 일반적인을 실행하는 알고리즘 많은 시간을 가진 임의의 초기화가 선택 최상의 결과를 얻을 수 있습니다.해야 합 무엇을 정의하는"가"를 의미한다.하나 측정하는 것을 의미 제곱 거리의 각 지점은 클러스터 센터도 있습니다.하려는 경우 자동으로 추측한 얼마나 많은 클러스터가있다,당신은 당신을 실행해야 하는 알고리즘의 전체 범위와 숫자의 클러스터입니다.어떤 좋은"최고의"측정,더 많은 클러스터는 항상보다 더 적은,그래서 당신은 방법이 필요를 처벌하는 너무 많은 클러스터입니다.이 MDL 토론에서 위키백과 좋은 출발점입니다.

K-의 클러스터링은 기본적으로 가장 간단한 모델 혼합물.때로는 도움이 됩 업그레이드 혼합물의 Gaussians 배 expectation maximization(에서 설명한 링크를 제공).이보다 더 강력한 k-의미입니다.그것은 조금 더 노력하는 그것을 이해하지만,당신이 할 때,그보다 훨씬 더 k-의미를 구현할 수 있습니다.

많은 다른 클러스터링 기술 과 같은 주로 융합 클러스터링과 클러스터링은 스펙트럼.주로 융합 클러스터링은 매우 쉽게 구현할 수 있지만,선택할 때를 중지 건물의 클러스터의 까다로운 일이 될 수 있습니다.당신이 경우에 주로 융합 클러스터링,당신은 아마에서 보고 싶 kd 트 에 대한 빠르게 가장 가까운 이웃을 검색합니다.smacl 의 대답에 대해 설명합 하나 약간씩 다른 방법을 주로 융합 클러스터링을 사용하여 보로 노 다이어그램입니다.

모델이 있는 자의 수를 선택합 클러스터에 대한 당신 같은 사람을 기반으로 Latent Dirichlet Allocation, 지만,그들은 많은 힘을 이해하는 구습니다.

수도 있습보고 싶 mean-shift 알고리즘을 보면 가까운 당신이 정말로 원하는 것.

다른 팁

그것은 나에게 소리처럼 당신이 찾고있는 대 K-means 알고리즘이 있습니다.

에서 언급했듯이 코멘트를 당신의 질문에,응답에 기초하는지 여부를 대량으로 간주 될 수 있는 스칼라에서 이러한 맥락이다.그렇다면,컬러 기반의 솔루션은 아마이 작동하지 않을 컬러로 자주하지 않으로 촬영되는 스칼라.

예를 들면,내가 지정된 영역 1 점의 높이,질량은 그 동일로는 같은 영역과는 10 포인트의 1/10 질량?이것이 진실한 경우,질량 스칼라 이러한 맥락에서,나를 보이는 경향이있는 알고리즘을 사용한 공간적으로 gouping 유사한 비 확장 가능한 값은,예를 들어, 보로 노이 다이어그램.

이 경우,어디에 인접한 두 개의 보로 노 지역은 충분히 가까이 대량 매치하고 거리,그들은 클러스터링할 수 있습니다 함께.을 반복할 수 있는 이 모든 클러스터입니다.

는 경우에 다른 한편으로는,당신의 질량는 확장,또는 질량에서 알 수 없는 위치를 보정할 수 있 주변 점에서,내가해 경향이 있을 것입 삼각 측량 과 윤곽에 입력된 데이터 및 사용 지역 사이의 윤곽을 찾는 클러스터의 비슷한 질량.

이 소리를 색상과 같은 양자화,당신의 수를 줄이는 색상에서 이미지입니다.방법 중 하나는 것을 그릴의 색상,공간과 결합 클러스터의 중심으로(또는 가중 평균)의 클러스터입니다.

의 이름을 정확히는 알고리즘 트리거 이 메모리의 실패이지만,저는 것이를 편집하고 팝업창이 나타나면,그러나 그러는 동안,당신을 봐야 한 색상을 양자화면의 일부를 알고리즘이 유용합니다.

시작으로"Convex Hull"문제입니다.당신은 또한 일부를 찾고"convex hull"같은 클러스터입니다.

참고는"클러스터를"은 막연하다.은 당신이 평균 질량에서 당신의 분야이다.몇 가지 포인트가 평균 이상 질량,그리고 일부는 아니다.얼마나 위의 평균을 의미를 발견했을 클러스터?얼마나 멀리 떨어져 있지 노드가 될 클러스터의 일부 또는 별도의 클러스터?

의 차이점은 무엇을 두는 산 능선?

당신이 계산하는"지형"-에 합류하는 모든 지점과 동일한 밀도로 지역입니다.하는 것이 필요합니다 당신이 자리를 선택하고 작업하에서 원하는 지점에서 반경 방향으로,위치 위치는 밀도 같습니다.에 연결할 수 있는 사람들로 포인트 지역입니다.

만약 당신이 고른 초기 지점에,현명하게 지어야 합니다.따기 시작 지점을 쉽기 때문에 당신은 시작에서는 지역이 되겠습니다.

기 때문에 당신은 이미 이야기에 대한 질량,왜 중력 기반의 솔루션입니다.간단한 입자 시스템을 필요가 없을 것입 슈퍼,정확한 당신이 그것을 실행하는 너무 오래 전에 만들 수 있는 더 나은 추측에서의 번호를 클러스터입니다.

는 경우에 대해 더 좋은 생각을 가지고 번호 클러스터,k-의 가장 가까운 이웃하는 것이 가능해집니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow