数据聚类如何帮助图像或模式识别

https://stackoverflow.com/questions/1436260

07-07-2019
|

题

我一直在尝试不同的数据聚类算法，致力于在代表节点的随机数据点之间查找聚类，我一直在阅读数据聚类用于图像识别。我无法建立联系，聚类数据如何帮助识别图像或面部识别。有人可以解释一下吗？

解决方案

毫不奇怪，聚类广泛用于模式识别，特别是图像识别：聚类是 还原过程, ，这个百万像素时代的图像需要沸腾......也是 产生类别的过程 这当然是有用的。

然而有 使用聚类作为图像识别技术的多种方法. 。造成这种多样性的原因之一是聚类可以应用于不同的级别，用于不同的目的：从基本像素级别到特征级别（特征可以是一条线，一个几何图形......），用于分类或其他目的。

在很高的水平上， 聚类是一种统计工具, ，它有助于发现各个维度在定义特定项目属于特定类别时的相对重要性。

一这种工具的[多种]用法是 监督学习, ，一组人类选择的项目（例如图像）以及与特定项目关联的标签（“这是一个苹果”，“这是另一个苹果”，“这是一个柠檬”...），然后聚类逻辑确定输入的每个维度对于帮助每组项目（苹果、柠檬...）适合不同聚类的重要性（例如，颜色可能相对不太重要，但是形状，或点的存在，或任何可能很重要的东西）。在这个训练阶段之后，新的图像可以被输入到逻辑中，并且通过查看该图像与特定簇的距离有多近，它被“识别”（作为香蕉！）。

当涉及到图像处理时，人们需要记住，任何“馈送”到聚类逻辑的东西都不一定是（事实上，很少）原始像素，而是各种“对象” 表征原始数据的各种“元素”（本质上是相对高维向量的集合，与在其他数据聚类示例中可能遇到的一些向量不同），并由该过程的前几个阶段产生。例如，面部识别的一个重要元素可能是眼睛中心之间的精确距离。在前面的阶段中，图像的处理方式是找出眼睛的位置（可能依赖于另一种基于聚类的逻辑）。然后，眼睛之间的距离以及许多其他元素被输入到最终的聚类逻辑中。

前面的描述只是使用聚类进行图像识别的一个示例。事实上，各种形式的神经网络已经在这个领域得到了非常成功的应用，并且可以说，从某种意义上说，这些神经网络正在聚类信息。神经网络成功的原因之一可能在于它们能够更加尊重地点在原始输入中找到的维度，以及他们在一个环境中工作的能力 层次时尚.

这篇文章的一个很好的结论是在线资源的简短列表，但我现在时间紧迫......“待续” ;-）

次日编辑: ：（未能尝试提供有关该主题的介绍性在线参考书目）

我对有关应用于人工视觉和图像处理的聚类主题的文献的搜索揭示了两个不同的......簇;-)

书籍如 图像处理和计算机视觉算法 J Parkey 酒吧威利，或 机器视觉：理论、算法、实践 M Seul 等。艾尔剑桥大学。这类书籍一般涵盖与降噪、边缘检测、颜色或强度转换以及图像处理链的许多其他元素相关的所有重要技术，其中大多数不涉及聚类甚至统计方法，并且只保留一章或一章。两次甚至少量提及应用于模式识别或其他任务的聚类。
学术论文和会议手册，专门涵盖应用于人工视觉等的聚类技术，但以最狭窄和最深入的方式（例如：Fukunaga 和 Narendra 算法的变体，用于字符识别中的应用，或用于在任何上下文中选择最近邻候选者的快速方法。）

简而言之，我觉得自己没有能力提出任何具体的书籍或文章建议。

您可能会发现，浏览 Google 图书中的标题（键入“人工视觉”或“图像识别”或上述某些标题）会提供丰富的信息。通过预览功能以及“关于本书”链接中的标签云（顺便说一句，集群的另一种应用程序），人们可以很好地了解各种书籍的内容，并可能决定购买其中一些。不幸的是，读者数量的减少和该领域潜在的有利可图的应用使这些书相对昂贵。另一方面，您可以下载（有时是免费的）讨论该领域高级主题的研究论文。这些也将显示在常规（网络）Google 或专门的存储库中，例如引用搜索器.

祝您在该领域的探索顺利！

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow