OCR: come trovare il giusto ColorMatrix di definire nuovi colori?
Domanda
Sono bloccato in questo momento di definire la dimensione di ogni riga. L'elenco che voglio raschiare ha vari colori in esso, e quello che mi disturba più di una selezione:
Come si può vedere l'immagine cerco di analizzare ottenuto uno sfondo bianco con testo verde. Lo sfondo è grigio selezione con testo nero. E ogni seconda linea ha uno sfondo un po 'più grigio, ma sono riuscito a manipolare il contrasto con un ColorMatrix.
Solo per riferimento, ho alcune altre ColorMatrizes come scala di grigi, Negativo, SetContrast, SetBrightness e così via.
Il mio metodo, che sta cercando le linee fa lavorare bene con la maggior parte del quadro, ma la selezione freni esso.
Così ora mi sono bloccato e non so cosa fare. Ho cercato su google per un'ora, ma non ho trovato una soluzione.
Ho pensato, che forse posso trasformare la sfondo grigio dalla selezione al bianco senza alterare il testo e scala di grigi il resto del quadro. Ma non riesco a trovare un ColorMatrix, che fa il lavoro.
Sai una o hai una soluzione migliore?
Soluzione
Perché usare un colore a matrice a tutti?
Si lavora (almeno per il tuo esempio specifico) molto più semplice con il funzionamento -threshold
di ImageMagick:
convert \
http://img18.imageshack.us/img18/210/lobbymd9.jpg \
-threshold 50% \
result.jpg
Risultati visivi:
=>
Thresholding fondamentalmente foglie sopra solo 2 valori (zero o massimo) per ciascun colore. Ogni valore inferiore alla soglia viene impostata su 0, valori superiori alla soglia vengono impostati a 255 (o 65535 se si lavora a profondità di 16 bit). L'effetto finale è una foto in bianco nero puro +.