Cómo crear datos de imagen como “Carta de reconocimiento de imágenes conjunto de datos” de la UCI

StackOverflow https://stackoverflow.com/questions/1270798

  •  13-09-2019
  •  | 
  •  

Pregunta

Estoy utilizando letter_regcog ejemplo de OpenCV, que utiliza datos de la UCI, que tiene la estructura siguiente:

Attribute Information:
     1. lettr   capital letter  (26 values from A to Z)
     2. x-box   horizontal position of box  (integer)
     3. y-box   vertical position of box    (integer)
     4. width   width of box            (integer)
     5. high    height of box           (integer)
     6. onpix   total # on pixels       (integer)
     7. x-bar   mean x of on pixels in box  (integer)
     8. y-bar   mean y of on pixels in box  (integer)
     9. x2bar   mean x variance         (integer)
    10. y2bar   mean y variance         (integer)
    11. xybar   mean x y correlation        (integer)
    12. x2ybr   mean of x * x * y       (integer)
    13. xy2br   mean of x * y * y       (integer)
    14. x-ege   mean edge count left to right   (integer)
    15. xegvy   correlation of x-ege with y (integer)
    16. y-ege   mean edge count bottom to top   (integer)
    17. yegvx   correlation of y-ege with x (integer)

ejemplo:

T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10

Ahora he segmentado imagen de la carta y quiere transformarla en datos como estos para poner reconocerlo pero no me ha entendido el significado de todo valor como "6. onpix # total de píxeles" lo que se quiere decir? Puede usted explicar la media de estos valores. gracias.

¿Fue útil?

Solución

No estoy familiarizado con el ejemplo letter_recog de OpenCV, pero esto parece ser un vector de características, o un conjunto de estadísticas sobre la imagen de una carta que se utiliza para clasificar las futuras apariciones de la letra. Los resultados de la segmentación que deben salir con una máscara binaria con 1 de la letra y en 0 de cualquier otro sitio. onpix es simplemente el recuento total de píxeles que caen en la carta, o en otras palabras, la suma de su máscara binaria.

La mayoría de los valores de reposo en la lista deben calcularse sobre la base del conjunto de píxeles con un valor de 1 en la máscara binaria. X e Y son sólo la posición del píxel. Por ejemplo, x-bar es sólo la media de la muestra de todas las posiciones x de todos los píxeles que tienen un 1 en la máscara. Usted debe ser capaz de encontrar fácilmente las referencias en la web para las definiciones matemáticas de la media, la varianza, covarianza y correlación.

14-17 son un poco diferentes, ya que se basan en píxeles del borde, pero los cálculos debería ser similar, algo más de un conjunto diferente de píxeles.

Otros consejos

Mi nombre es Antonio Bernal. En la página 3 de este artículo encontrará una buena descripción para cada valor. Reconocimiento minúsculas Con la Holanda del estilo adaptativo clasificadores .

Si tiene cualquier duda, hágamelo saber. Estoy tratando de hacer este trabajo algoritmo, pero mi problema es que no sé cómo escalar los valores para ajustarlos a la gama 0-15. ¿Tiene alguna idea de cómo hacer esto?

Otro enlace de Google académico -> Carta de Reconocimiento El uso de Holanda- estilo de clasificadores adaptativos

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top