Вопрос

Я пытаюсь определить, насколько хорошо входной вектор соответствует данному центру кластера.Я могу довольно легко найти наилучшее совпадение (центр с минимальным евклидовым расстоянием до входного вектора является наилучшим), однако теперь мне нужно определить, насколько это хорошее совпадение.

Чтобы сделать это, мне нужно найти разброс (стандартное отклонение?) векторов, которые создают центроид, затем посмотреть, меньше ли расстояние от моего входного вектора до центра, чем разброс.Если это больше, чем разброс, я должен быть в состоянии сказать, что у меня нет подходящих кластеров (учитывая, что наилучший плохо подходит для входного вектора).

Я не уверен, как найти разброс по кластерам.У меня есть все центральные векторы, и все обучающие векторы помечены их ближайшим кластером, я просто не могу точно понять, что мне нужно сделать, чтобы получить разброс.

Надеюсь, это понятно?Если нет, я попытаюсь сформулировать это заново!ТИА Иэн

Это было полезно?

Решение

Используйте функцию distance и вычислите расстояние от вашей центральной точки до каждой помеченной точки, затем вычислите среднее значение этих расстояний.Это должно дать вам стандартное отклонение.

Другие советы

Если вы переключитесь на использование другого алгоритма, такого как Смесь гауссианов, вы получите распространение (например, ЗППП.отклонение) как часть модели (результат кластеризации).

http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/mixture.html

http://en.wikipedia.org/wiki/Mixture_model

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top