OCR:どのように整理不一致、画像を比較し、この速いを行うには?

StackOverflow https://stackoverflow.com/questions/574923

  •  05-09-2019
  •  | 
  •  

質問

私は、各文字がビットマップに保存され、すぐにそれがどの文字かを決定するための方法を探しています持っていることができました。

そこで私は、1と0の配列に可能なすべての文字を格納し、私はちょうどつかんだビットマップの配列にそれらを比較しようとしています。

私は、私が得たどのように多くの黒画素の比較寸法を比較するというように、これらすべてのチェックが(単なる推測...)遅いような単純なチェックを行うことができます。

それでは、私が探していることは一つだけのアレイが残るまで、アウト不一致の配列と種類のセットに配列を比較する無作為に下から上にトラフすべてのピクセルを行く、または方法、です。しかし、どのように私はそれを実装することができますか?

ご協力いただきありがとうございます。

スヴェン

役に立ちましたか?

解決

OCR-世界では、それはあなたがtargetresourceし、元の比較リソース間の「完璧な試合」に遭遇することはかなりまれません。

実際には、科学の巨大な分野だが、ここではあなたにいくつかの基本的な知識を与えるべき対象の素敵な論文です: http://www.discover.uottawa.ca/~qchen/my_papers/ master_thesis.pdfする

このようなアルゴリズムは非常に数学重いとなりまし方法標準のx86 CPU用に最適化されていることに注意してください。

あなたは完璧にマッチ(私は意味、本当に完璧、ダウンバイトツーバイトまで)を探している、あなたは、この迅速かつ簡単に実装するために、私は「速い明白な不一致をスキップ」を行うことをお勧めしたい場合 - ちょっとアルゴリズム - のような何かます:

1)異なる場合、それはあなたが

のために何を見ていないですが、配列のサイズを比較し

2)各ビットマップのハッシュ値を比較する

3)各ビット/バイト一つ一つを比較して、すぐに違いを見ると、それはあなたが

のために何を見ていないのです

4)勝利は、あなたがマッチを見つけた:)

これは非常にあなたが達成しようとしているものに応じて、ゆっくりと、しかし、実装が容易であり、それは動作します。だから、プロトタイプ似たアプリケーションのためによく合います。

(:私が言ったように、OCR(およびデジタル信号処理の他のすべての形式)は、研究の巨大な分野なので、それはあなたが、人々は悲しいことに、迅速forumpostであなたを教えることを期待できるものではありません

幸運

[EDIT]あなたのOQでのコメントを見ると、私はあなたのための最速になり、ハッシュテーブル/辞書データ構造のために行くと言うでしょう。その、またはバイナリ検索ツリー...どちらも非常に依存しONJあなたのハッシュ鍵生成:)

[EDIT2(XDの)「それは、コンピュータによって生成されたテキスト別名だ。背景が異なっているが、テキストは常に同じ色を有しています。」そこにかなり重要な情報:Pだけでなく、常に同じテキスト/ビットマップのサイズはありますか?私は単純にハッシュ値がテキストのみ(とこれもOFCの形状)の色に依存するように、あなたがプリセット背景色を破棄し、独自のハッシュアルゴリズムを実装するか、いずれかがあなたの目標にすべてのバックグラウンドピクセルを書き換えすることをお勧めしたいですあなたのオリジナルと同じ色にする(?またはちょうどあなたのターゲットと元の背景を設定し、あなたがここで戦っているデータに再び依存 - の必要性より多くの情報を:))。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top