Quale software consiglieresti di migliorare l'immagine prima dell'OCR (riconoscimento ottico dei caratteri)? [chiuso]

StackOverflow https://stackoverflow.com/questions/142743

Domanda

Attualmente stiamo cercando modi per migliorare la qualità dell'immagine prima dell'invio all'OCR. Il motore OCR che stiamo attualmente utilizzando è l'API Scansoft di Nuance (v15). Stavamo effettuando ricerche sugli Strumenti di comando ma da allora abbiamo deciso di cercare altrove. I costi di licenza associati a Lead Tools sono semplicemente troppo grandi. Per cominciare, stiamo cercando semplici funzioni di miglioramento delle immagini come: deskewing, despeckling, rimozione delle linee, rimozione dei fori, affilatura, ecc. Stiamo eseguendo un mix di software .NET e Java, ma sarebbe preferibile una soluzione java.

È stato utile?

Soluzione

Kofax è buono per la pre-elaborazione, ma per i tipi di pulizia di cui stai parlando potrebbe essere eccessivo a meno che le immagini non siano davvero cattive. A meno che la tua specialità non sia l'elaborazione delle immagini, ti consiglio di lavorare con un fornitore che esegue la pulizia delle immagini e l'OCR in modo da poterti concentrare sul valore che effettivamente aggiungi.

Abbiamo concesso in licenza il kit di sviluppo OCR di ABBYY ( ABBY SDK ) e l'abbiamo trovato superbo sia per l'elaborazione delle immagini che per l'OCR. L'API è piuttosto estesa e le app di esempio, la guida e il supporto sono stati straordinari. Consiglio vivamente di dare un'occhiata.

Altri suggerimenti

Disclaimer: lavoro per Atalasoft

Disponiamo di tali funzioni e licenze runtime esenti da royalty per .NET.

http://www.atalasoft.com/products/dotimage/

Abbiamo anche componenti OCR tra cui un wrapper .NET per Abbyy, Tesseract e altri e generazione di PDF ricercabili (immagine sopra il testo in un PDF)

Non sono sicuro che questo sia abbastanza all'altezza degli standard di cui voi ragazzi avreste bisogno, ma forse dovreste guardare alcuni dei Paint.Net API. Non so quanto sarebbe facile estrarre i loro algoritmi di elaborazione delle immagini da utilizzare nel tuo progetto, ma credo che facciano alcune delle cose che stai cercando. Inoltre è un progetto open source con una licenza MIT, quindi dovrebbe essere piuttosto amichevole per l'uso aziendale.

Ricerca su KOFAX VRS su KOFAX.com

Forse JMagick, è un'interfaccia Java open source di ImageMagick. È implementato sotto forma di un sottile livello JNI (Java Native Interface) nell'API ImageMagick. È concesso in licenza in base alla LGPL, quindi non dovrebbe essere un problema in termini di licenza.

http://sourceforge.net/projects/jmagick/

Suggerirei Intel per le sue licenze runtime a costo zero.

Dipende dal numero e dalla qualità delle immagini originali. Il codice gestito e i kit di strumenti di imaging funzioneranno, ma non è sempre la soluzione migliore se hai elaborato diversi milioni di immagini da elaborare. Per piccoli lotti e budget limitati, sono d'accordo con i precedenti poster che progetti come Aforge, Paint.NET e altre librerie di visione artificiale open source faranno il trucco. Certo, sei da solo se i risultati non migliorano ... Almeno questo ti consente di mettere tutto ciò di cui hai bisogno in un'unica applicazione a basso costo.

Se stai elaborando diverse centinaia di migliaia di immagini al mese, ti suggerirei di dividere il processo in un passaggio di flusso di lavoro più piccolo e di modificarlo ciascuno fino a quando il tuo costo per immagine si avvicina al massimo a zero possibile. Scoprirai che i risultati dell'OCR aumentano rapidamente all'inizio e poi si stabilizzano prima del previsto. (Non sono un grande fan di OCR ma ha il suo posto)

Uso un prodotto Windows commerciale da Riconoscimento per elaborare e ripulire le immagini prima dell'OCR in modalità batch utilizzando script adeguati per vari tipi di immagini. Se un'immagine non supera il controllo qualità o viene rifiutata dal motore OCR, viene "riparata". a mano usando un'applicazione .NET personalizzata creata con il toolkit Atalasoft . Elaborazione batch di tutto e toccare solo ciò che non funziona.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top