Sklearn文档:

请注意,MDS的目的是找到数据的低维表示(这里2D),其中距离很好地尊重原始高维空间中的距离,与其他歧管学习算法不同,它不寻求一个低维空间中数据的各向同性表示。

有人可以用外行的术语来阐述什么区别?

有帮助吗?

解决方案

您提供的链接中的图像,切断的球体及其较低维度的表示形式,以某种方式解释差异。

切断的球是在三维空间中的一组点,但我们希望对其进行二维表示。歧管学习的目的是(令人震惊的是)找到一个歧管:该三维空间的子集(a)非常适合构成切断球体的所有点,并且(b)可以用两种 - 维坐标系。

如果您查看切断的球体的其他一些较低维度的表示,就像他们将其拿走并将其放到矩形中,以便它适合二维。它采用了切断的球体,并弄清了一个新的坐标系,该系统将尽可能紧密地映射到构成切断球体的所有点上。

不过,MDS较低维度的表示更像是一个被切断的球铸在墙上的阴影。与其找到紧密适合球体的新坐标系,不如“忘记”它认为最大的尺寸,同时保持相同的距离与所有点相同的距离。

一个好的类比是地球的地图。地球的良好地图制造了一个新的坐标系,该系统适合球体上的2D表面。为此,它必须扭曲位置之间的相对距离,但是您最终会得到有效的2D坐标,这些坐标与全球的位置非常相关。

您不必这样做,而可以从北极和南极上方拍摄两张地球的照片,然后将它们粘在背部。您仍然有2D代表地球,但是它不像坐标系统那样好。

这并不是说MD是“不好”。它只是在做不同的事情。在执行某种统计过程之前,您可能不会使用MDS降低维度,但是如果您试图制作图形,以了解多维点的距离有多接近,则可能是一个不错的选择。

许可以下: CC-BY-SA归因
scroll top