Domanda

La risposta accettata alla domanda C ++ Library per il riconoscimento delle immagini: le immagini che contengono parole a stringa consiglia di:

  1. Upsize / Ridimensionare l'immagine in ingresso a 300 DPI.

Come faccio a fare questo ... Ho avuto l'impressione che fosse DPI per i monitor, non formati di immagine.

È stato utile?

Soluzione

Credo che il termine più preciso qui è ricampionamento . Volete una risoluzione in pixel abbastanza alto per sostenere accurate OCR. Dimensione dei caratteri (ad esempio in punti ) viene tipicamente misurata in unità di lunghezza, non pixel. Da 72 punti = 1 pollice, dobbiamo 300/72 pixel-per-punto per una risoluzione di 300 dpi ( "pixel per pollice"). Ciò significa che un carattere tipico 12 punti ha un'altezza (o più precisamente, base-line basare distanza in linea nel testo interlinea singola) di 50 pixel.

Idealmente, i documenti di origine devono essere acquisite con una risoluzione adeguata per il dato dimensione del carattere, in modo che il tipo di carattere nell'immagine è alta circa 50 pixel. Se la risoluzione è troppo alto / basso, si può facilmente ricampionare l'immagine utilizzando un programma di grafica (ad esempio GIMP ) . È anche possibile fare questo livello di programmazione tramite una libreria grafica, come ad esempio ImageMagick che ha interfacce per molti linguaggi di programmazione.

Altri suggerimenti

DPI ha senso ogni volta che sei in relazione un'immagine in pixel di un dispositivo fisico con una dimensione dell'immagine. Nel caso di OCR, di solito significa la risoluzione della scansione, vale a dire il numero di pixel si ottiene per ogni pollice della vostra scansione. Un font 12 punti è destinato ad essere stampato a 12/72 pollici per linea, e un carattere maiuscolo potrebbe occupare circa 80% di quella; quindi sarebbe alto circa 40 pixel quando digitalizzata a 300 DPI.

Molti formati di immagine hanno un DPI ha registrato in loro. Se l'immagine è stata scansionata, questo dovrebbe essere l'impostazione esatto dallo scanner. Se ne è venuto da una fotocamera digitale, si dice sempre 72 DPI, che è un valore di default mandato dalla specifica EXIF; Questo perché una macchina fotografica non può conoscere la dimensione originale dell'immagine. Quando si crea un'immagine con un programma di imaging, si potrebbe avere la possibilità di impostare il DPI a qualsiasi valore arbitrario. Questa è una comodità per di specificare come si desidera che l'immagine finale da utilizzare, e non ha alcuna attinenza con dettaglio contenuto nell'immagine.

Ecco una domanda precedente che chiede i dettagli di ridimensionamento di un'immagine: come faccio a fare il ridimensionamento di alta qualità di un'immagine?

Il software OCR è tipicamente progettato per funzionare con "normali" le dimensioni dei caratteri. Da un punto di vista dell'immagine, ciò significa che si cercherà lettere forse circa 30 a 100 pixel gamma di altezza. Immagini di risoluzione molto più alta produrrebbero lettere che appaiono troppo grande per il software OCR per elaborare in modo efficiente. Allo stesso modo, le immagini di risoluzione inferiore non fornirebbero abbastanza pixel per il software a riconoscere le lettere.

"Come faccio a fare questo ... Ho avuto l'impressione che fosse dpi per i monitor, non formati di immagine".

DPI acronimo di punti per pollice. Che cosa ha a che fare con i monitor? Bene, abbiamo un pixel in tre subpixel RGB. Più alto è il DPI, i maggiori dettagli si stipare in quello spazio.

DPI è una misura utile per i display e le stampe, ma nulla di utile ... in realtà, nulla per un'immagine stessi formati.

La ragione di DPI essere etichettato all'interno alcuni formati è quello di istruire i dispositivi da visualizzare in quel risoluzione, ma da quanto ho capito, praticamente tutti ignorano che l'istruzione e fa del suo meglio per ottimizzare l'immagine per una particolare uscita.

È possibile modificare 72 dpi a 1 dpi o 6000 dpi in un formato di immagine e non farà una differenza di sorta su un monitor. "Upsize / ridurre le dimensioni di 300 dpi" non ha alcun senso. Ricampionamento non cambia DPI sia. Provalo in Photoshop, deselezionare "Ricampionare" quando si cambia il DPI e vedrete alcuna differenza. NON diventerà più grande o più piccolo.

DPI è totalmente priva di significato per i formati immagine, IMO.

Se il vostro obiettivo è l'OCR, DPI ha senso in quanto il numero di punti nella vostra immagine per ogni pollice di documento scansionato originale. Se il DPI è troppo bassa, l'informazione è andato per sempre, e l'interpolazione bicubica anche non sta per un lavoro brillante recuperarlo. Se il DPI è troppo alto, è facile buttare via pezzi.

Per ottenere il lavoro fatto; Sono un grande fan del set di strumenti NetPBM / pbmplus; lo strumento per iniziare è pnmscale, anche se hai una bitmap che si desidera prendere in considerazione strumenti connessi, come pbmreduce.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top