我试图检测输入向量如何适合一个给定的群集中心。我可以很容易地(与该输入向量最小欧式距离的中心是最好的),但是,我现在需要的工作有多好比赛就是找到最佳匹配。

要做到这一点,我需要找到其积聚的质心向量的扩散(标准偏差σ),然后查看是否从我的输入矢量到中心的距离小于所述传播。如果它超过了传播比我应该可以说,我没有集群,以适应它(因为最好不适合输入向量以及)。

我不知道如何找到每个集群的传播。我把所有的中心向量,所有的训练矢量都标有自己最近的聚类,我只是不太捉摸正是我需要做的就是传播。

我希望这清楚了吗?如果没有,我会尝试改写了! TIA 伊恩

有帮助吗?

解决方案

使用距离函数,并计算每个标记的点从中心点的距离,然后计算出这些距离的平均值。这应该给你的标准偏差。

其他提示

如果您切换到使用不同的算法,例如高斯混合,将得到的扩展(例如,标准。偏差)作为模型(聚类结果)的一部分。

http://home.deib.polimi.it/matteucc/聚类/ tutorial_html / mixture.html

http://en.wikipedia.org/wiki/Mixture_model

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top