Domanda

Buona notte:)

Al momento sto giocando con la libreria Diavolo che mi permette di caricare in immagine e controllare i valori RGB per pixel. Proprio come un progetto di apprendimento personale, sto cercando di scrivere un sistema OCR di base per un paio di immagini di me che ho fatto in Photoshop.

Sono successo in grado di rimuovere tutte le distorsioni dell'immagine e ho lasciato con testo e numeri. Non sto attualmente alla ricerca di una rete neurale avanzato che impara da input. Voglio iniziare in modo relativamente facile e così ho deciso di identificare i singoli personaggi e contare i pixel in quei caratteri.

Ho due problemi:

  • L'identificazione dei singoli caratteri.
  • La cosa più importante: ho bisogno di un algoritmo per contare i pixel collegati (dello stesso colore), senza contare pixel ho già contati. Non ho alcun background mathemathical quindi questo è il più grande problema per me.

Qualsiasi aiuto in materia è apprezzato, grazie.

modifica:

Ho etichettato questa domanda come C ++, perché questo è ciò che sono attualmente in uso. Tuttavia, pseudo-codice o il codice facilmente leggibile da un'altra lingua è anche bene.

Altri suggerimenti

Non sono sicuro che questo aiuta, ma c'è un lib GPL OCR chiamato gocr .

Mi scuso se questo è troppo off-topic, ma IMHO Vigra (non l'altro!) è una libreria molto migliore elaborazione delle immagini per C ++ che diavolo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top