Pregunta

He estado jugando con diferentes algoritmos de agrupación de datos que trabajan para encontrar agrupaciones entre puntos de datos aleatorios representados como nodos, sigo leyendo que la agrupación de datos se utiliza para el reconocimiento de imágenes. No puedo establecer la conexión, ¿cómo ayuda la agrupación de datos en el reconocimiento de una imagen o en el reconocimiento facial? alguien puede explicar esto?

¿Fue útil?

Solución

No sorprende que la agrupación se use para el reconocimiento de patrones en general, y el reconocimiento de imágenes en particular: la agrupación es un proceso reductor , y las imágenes en esta era de megapíxeles necesitan reducirse ... También es un proceso que produce categorías y que, por supuesto, es útil.

Sin embargo, hay muchos enfoques para el uso de la agrupación como una técnica para el reconocimiento de imágenes . Una de las razones de esta diversidad es que la agrupación se puede aplicar a diferentes niveles, para diferentes propósitos: desde el nivel básico de píxeles hasta el nivel de entidad (la entidad puede ser una línea, una figura geométrica ...), para clasificación o para otros fines.

En un nivel muy alto, el agrupamiento es una herramienta estadística , ayuda a descubrir la importancia relativa de varias dimensiones para definir la pertenencia de un elemento en particular a una categoría en particular.

One [de muchos] usos [s] de dicha herramienta, es con aprendizaje supervisado , mediante el cual un conjunto de los elementos (digamos imágenes) se introducen en la lógica basada en clúster, junto con una etiqueta asociada con un elemento en particular (`` esta es una manzana '', `` esta es otra manzana '', `` este es un limón '' ... ), la lógica de agrupamiento determina cuánto importa cada dimensión de la entrada para ayudar a cada grupo de elementos (manzanas, limones ...) a encajar en un grupo distinto (por ejemplo, el color puede importar relativamente poco, pero la forma o el presencia de puntos, o lo que sea que importe mucho). Después de esta fase de entrenamiento, se pueden alimentar nuevas imágenes a la lógica y al ver qué tan cerca de un grupo en particular cae esta imagen, se reconoce y reconoce. (como un plátano!).

Cuando se trata del procesamiento de imágenes, uno debe recordar que cualquier cosa que se alimente para la lógica de agrupamiento no son necesariamente (de hecho, raramente) los píxeles en bruto, sino varios 'objetos'. caracterizando varios '' elementos '' de los datos originales (esencialmente una colección de vectores de dimensiones relativamente altas, no muy diferentes a algunos que uno puede haber encontrado en otros ejemplos de agrupación de datos), y producidos por etapas previas del proceso. Por ejemplo, un elemento importante del reconocimiento facial es probablemente la distancia exacta entre el centro de los ojos. En etapas anteriores, la imagen se procesa de una manera que determina dónde están los ojos (posiblemente confiando en otra lógica basada en la agrupación). Luego, la distancia entre los ojos, junto con muchos otros elementos, se alimenta a la lógica de agrupación final.

La descripción anterior es solo un ejemplo del uso de la agrupación para el reconocimiento de imágenes. De hecho, se han utilizado varias formas de redes neuronales, con mucho éxito, en este dominio, y se puede argumentar que, en cierto sentido, estas redes neuronales están agrupando información. Una de las razones del éxito de las redes neuronales puede deberse a su capacidad de ser más respetuosos con la dimensión localidad que se encuentra en la entrada original, y también su capacidad de trabajar de manera jerárquica .

Una buena conclusión para este artículo sería una breve lista de recursos en línea, pero estoy presionado por el tiempo en este momento ... "para continuar". ;-)

Edición al día siguiente : (intento fallido de proporcionar una bibliografía introductoria en línea sobre el tema)

Mi búsqueda de literatura sobre el tema de la agrupación aplicada a la visión artificial y el procesamiento de imágenes reveló dos ... agrupaciones distintas ;-)

  • Libros como Algoritmos para procesamiento de imágenes y visión por computadora J Parkey pub Wiley, o Visión artificial: teoría, algoritmos, aspectos prácticos M Seul et. Al Cambridge UP. Tales libros generalmente cubren todas las técnicas importantes asociadas con la reducción de ruido, la detección de bordes, la conversión de color o intensidad, y muchos otros elementos del procesamiento de imágenes.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top