Pixel di base / Cell Counting Algoritmo

https://stackoverflow.com/questions/589144

09-09-2019
|

Domanda

Buona notte:)

Al momento sto giocando con la libreria Diavolo che mi permette di caricare in immagine e controllare i valori RGB per pixel. Proprio come un progetto di apprendimento personale, sto cercando di scrivere un sistema OCR di base per un paio di immagini di me che ho fatto in Photoshop.

Sono successo in grado di rimuovere tutte le distorsioni dell'immagine e ho lasciato con testo e numeri. Non sto attualmente alla ricerca di una rete neurale avanzato che impara da input. Voglio iniziare in modo relativamente facile e così ho deciso di identificare i singoli personaggi e contare i pixel in quei caratteri.

Ho due problemi:

L'identificazione dei singoli caratteri.
La cosa più importante: ho bisogno di un algoritmo per contare i pixel collegati (dello stesso colore), senza contare pixel ho già contati. Non ho alcun background mathemathical quindi questo è il più grande problema per me.

Qualsiasi aiuto in materia è apprezzato, grazie.

modifica:

Ho etichettato questa domanda come C ++, perché questo è ciò che sono attualmente in uso. Tuttavia, pseudo-codice o il codice facilmente leggibile da un'altra lingua è anche bene.

Soluzione

I href="http://en.wikipedia.org/wiki/Flood_fill" lavorerà per il conteggio dei pixel inclusi, fino a quando si dispone di le immagini filtrate fino a semplici immagini bitmap in bianco e nero.

Detto questo, è possibile eseguire il riconoscimento dei caratteri confrontando ogni personaggio per una serie di immagini standard di ogni personaggio nel set, che misura la somiglianza, e quindi scegliendo il personaggio con il punteggio più alto.

Date un'occhiata a questo domanda per ulteriori informazioni.

Altri suggerimenti

Non sono sicuro che questo aiuta, ma c'è un lib GPL OCR chiamato gocr .

Mi scuso se questo è troppo off-topic, ma IMHO Vigra (non l'altro!) è una libreria molto migliore elaborazione delle immagini per C ++ che diavolo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow