スキャンされたドキュメントからOCRの精度を向上させます

質問

標準の兄弟A3多機能を使用して多くのA3ドキュメントをスキャンしてから、FinEReader Proを使用して画像をOCRしています。

しかし、私はキャラクターに多くのエラーが認識されていることと、多くの非アルファニュメンタの奇妙なキャラクターが得られています。

誰かが、スキャンされた画像の前処理、または認識されたテキストでの後処理のいずれかをプログラム的に改善するためのヒントを教えてもらえますか？

編集：サンプルPDFを見つけます. 。これには、私が最も貧しい結果を得るいくつかのサンプル画像が含まれています。

解決

どこかに投稿できるサンプル画像がありますか？ FinEreaderは、より優れたOCRエンジンの1つであるため、結果が不十分な理由は間違いなくあります。

それは、コントラストの不十分な設定としきい値設定、画像歪み、スキャナーの汚れたローラー、複雑な背景と色付きの背景、ディザの背景、フォントサイズが小さすぎる、DPIが低すぎるなどのスキャンなどに関連する可能性があります...

添付の画像を見た後、いくつかの小さな問題があります。

背景ページには汚い斑点がたくさんあります。 Finereaderは、あなたの画像でこれを使用して合理的な仕事をしているようです。
わずかなスキューがありますが、それは引き起こされていません。問題はありません。
Finereaderは、列ヘッダーに使用される太字の背の高いArialタイプフォントと混同されています。
4大きな問題は、コントラストが悪く、画像が曖昧なページの下部領域であるようです。これはスキャナーの問題のようですが、印刷の問題が原因である可能性があります。

印刷は非常に貧弱で、新聞のスキャンだと思います。あなたのエラーのほとんどはスキャンの問題によるものなので、結果をプログラム的に改善することは困難です。

まず、わずかに高い解像度を使用してグレイスケールの画像をスキャンして、それが役立つかどうかを確認します。 Finereaderは、グレースケールの画像でうまく機能します。 B/W画像が必要な場合は、スキャナードライバーに動的なしきい値の設定が含まれているかどうかを確認し、オンにします。

あなたの画像は、OCRエンジンにとって簡単な作業ではありません。スキャンを改善できれば、より良い結果が得られます。 3ページは、右下隅に多くのノイズがあります。

どのバージョンのFinereastderを使用していますか？ FR10は、おそらく以前のバージョンよりも良い結果をもたらすでしょう。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow