OCR - la maggior parte & # 8220; diverso & # 8221; o & # 8220; riconoscibile & # 8221; Caratteri ASCII?

StackOverflow https://stackoverflow.com/questions/1412693

Domanda

Sto cercando un modo per determinare il maggior numero di "differenti" o "riconoscibile" N caratteri ASCII ... Ad esempio, se N = 10, quali sarebbero gli N caratteri più diversi nel set ASCII da 0x21 a 0x7E? Ovviamente, il carattere "X" è molto diverso da " O " (la lettera), ma "O" (la lettera) è molto simile a "0" (zero). Supponendo che un sottoinsieme di caratteri OCR limitato, in modo tale che zero e la lettera O vengano rilevati come l'uno o l'altro, e non ci si debba preoccupare se fosse uno zero o una lettera O, quale sarebbe la N più diversa caratteri che i tipici motori OCR (ad esempio Tesseract) riconoscono facilmente da un'immagine di input di scarsa qualità? Assunzioni. come " + " e " t " potrebbe essere ampiamente scambiato l'uno con l'altro. può essere creato, e quindi ogni carattere di input, indipendentemente dal fatto che sia " + " oppure " t " corrisponderebbe solo all'uno o all'altro.

Grazie, Ben

È stato utile?

Soluzione

Sfortunatamente non penso che ci sarà un'unica risposta unica per questo.

Dipenderà dal tipo di carattere: confronta i diversi modi in cui sono rappresentati 0, f, s e fiorisce anche stilistico.

Dipenderà dal tipo di danno che i personaggi ricevono prima di essere scansionati, alcuni potrebbero essere più resistenti contro le sbavature, altri contro tagli, altri contro sovrascrittura.

Se stai cercando una rappresentazione che sopravviva meglio alla stampa, alla scansione e all'OCR, forse un codice a barre 1D o 2D sarebbe una scelta migliore?

Altri suggerimenti

Solo un modo per rispondere a questa domanda: provalo. Creare un set di campioni per ogni lettera ed eseguire l'OCR su ciascun campione. Le lettere che l'OCR ottiene più spesso sono le più "riconoscibili"; le lettere che l'OCR sbaglia di frequente sono le più "diverse".

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top