Estado de la técnica en el reconocimiento de rostros

https://stackoverflow.com/questions/2903453

04-10-2019
|

Pregunta

He mirado un poco en el reconocimiento de caras recientemente. Sin embargo, estoy overwelmed por el número de algoritmo que existen.

PCA, LDA, AIF, Gabor Wavelets, AAM ...

Decir que quería hacer algo como este .. . ¿Qué algoritmos usarías o que los documentos le lea?

Solución

Creo que la primera cosa que debe hacer es darse cuenta de que los algoritmos que ha enumerado se utilizan en diferentes etapas de reconocimiento de rostros.

En primer lugar, tiene que decidir sobre la representación, i. mi. Las características de su uso. Estos pueden ser píxeles primas, filtros de Gabor, algún tipo de descriptores de forma, modelos deformables, etc.

A continuación, normalmente se quiere reducir la dimensionalidad de sus características. Aquí es donde algoritmos como PCA, ICA, o LDA vienen en, que los puntos de datos de proyectos en un espacio dimensional menor tratando de conservar la mayor parte de la varianza (PCA) o para asegurar la separación óptima de los puntos de diferentes categorías (LDA).

A continuación, es probable que desee entrenar a un clasificador en sus características para distinguir entre las caras de diferentes personas. Hay un gran número de algoritmos para elegir aquí, tales como el vecino más cercano, máquinas de vectores de soporte, modelos ocultos de Markov, Bayes Nets, etc.

Tenga en cuenta que la elección de un algoritmo para una etapa particular puede o no puede depender de los algoritmos para otras etapas. Para los casos, PCA se puede usar para reducir la dimensionalidad de casi cualquier tipo de características. Por otro lado, no es inmediatamente evidente cómo se puede utilizar un soporte vector clasificador máquina para caras representados por una malla deformable.

Creo que lo primero que se debe tratar de hacer es definir su problema de manera muy precisa. ¿Quieres que distinguir entre caras de sólo unas pocas personas, como reconocer a los miembros de su familia en las fotos? ¿Quieres reconocer a las personas de una enorme base de datos? ¿Tiene un montón de la formación de imágenes para cada cara, o sólo unos pocos? ¿Quieres manejar diferentes orientaciones y las condiciones de iluminación?

Las respuestas a estas preguntas determinan lo complicado es su problema, y ??sin duda afectará a su elección de algoritmos.

EDIT: He aquí una tesis de alguien que intentó resolver un problema similar. Es a partir de 2002, pero en mi humilde opinión, es un lugar bueno para comenzar.

Otros consejos

Usted debe considerar mapas de profundidad. Esto es estado de la técnica. Trate de leer acerca de las representaciones esféricas dispersas. Eigen se enfrenta no sólo es muy robusto. No es invariante a varios factores. Estado del reconocimiento arte de la cara está usando PCL 3d que tiene información de profundidad. Esto permitirá reconocer incluso en la oscuridad. Se podría utilizar una cámara Asus o una cámara Kinect a la información sobre profundidad a cobro revertido. Espero que ayude!

Haar en cascada que se ejecuta en un puerto Marilena.

Una cascada de Haar es un algoritmo que lee un archivo y le dice al ordenador qué algo que se parece. Lo he utilizado en el pasado para detectar las caras, vasos, sólo una sonrisa, las manos y una lata de Coca Cola.

http://en.wikipedia.org/wiki/Haar-like_features

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow