Individuazione del testo all'interno dell'immagine

https://stackoverflow.com/questions/1848

08-06-2019
|

Domanda

Attualmente sto lavorando a un progetto e il mio obiettivo è individuare il testo in un'immagine.L'OCR del testo non è ancora mia intenzione.Voglio fondamentalmente ottenere i limiti del testo all'interno di un'immagine.Sto utilizzando il componente di imaging AForge.Net per la manipolazione.Qualche aiuto in un senso o nell'altro?

Aggiornamento 05/02/09:Da allora ho seguito un'altra strada nel mio progetto.Tuttavia ho tentato di ottenere testo utilizzando MODI (Microsoft Office Document Imaging).Ti consente di eseguire l'OCR di un'immagine e di estrarne il testo con una certa facilità.

Soluzione

Questa è un'area attiva di ricerca.Ci sono letteralmente una gran quantità di articoli accademici sull’argomento.Sarà difficile darti assistenza soprattutto senza ulteriori dettagli.Cerchi tipi di testo specifici?Caratteri?Solo inglese?Conosci la letteratura accademica?

Il "rilevamento del testo" è un problema standard in qualsiasi sistema OCR (riconoscimento ottico dei caratteri) e di conseguenza ci sono molti bit di codice sugli interweb che si occupano di questo.

Potrei iniziare a elencare pile di link da Google, ma ti suggerisco di fare una ricerca per "rilevamento testo" e iniziare a leggere :).È disponibile anche un ampio codice di esempio.

Altri suggerimenti

riconoscere il testo all'interno di un'immagine è davvero un argomento caldo per i ricercatori in quel campo, ma ha iniziato a crescere senza controllo solo quando captcha è diventata la "norma" in termini di difesa contro i bot spam.Perché usare i captcha come protezione?beh perché è/era molto difficile individuare (e leggere) il testo all'interno di un'immagine!

Il motivo per cui menziono i captcha è perché il maggior progresso* viene fatto in quella piccola area e penso che la soluzione migliore potrebbe essere trovata lì.soprattutto perché i captcha riguardano effettivamente l'individuazione del testo (o qualcosa che assomigli al testo) all'interno di un'immagine disordinata e successivamente il tentativo di leggere correttamente le lettere.

quindi se riesci a trovare te stesso un buon strumento di interruzione captcha open source probabilmente hai tutto ciò che ti serve per continuare la tua ricerca...
Probabilmente potresti anche buttare via il codice più difficile che gestisce il riconoscimento dei caratteri stesso, perché questi OCR vengono utilizzati per leggere testo distorto, cosa che non devi fare.

*:progresso in termini di visibilità, usabilità e pratico informazioni per un "non ricercatore"

Se sei d'accordo con l'utilizzo di un'API online per questo, l'API all'indirizzo http://www.wisetrend.com/wisetrend_ocr_cloud.shtml può eseguire il rilevamento del testo oltre al solo OCR.

Trasformazione della larghezza del tratto può farlo per te.Questo è almeno ciò che MS ha sviluppato per il sistema operativo dei propri telefoni cellulari.Una discussione sull'implementazione è qui su https://stackoverflow.com/

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow