質問

おやすみ :)

私は現在、画像をロードしてピクセルごとのRGB値を確認できるDevILライブラリを使って遊んでいます。単なる個人的な学習プロジェクトとして、Photoshop で自分で作成したいくつかの画像用の非常に基本的な OCR システムを作成しようとしています。

画像の歪みをすべて取り除くことができ、テキストと数字が残りました。私は現在、入力から学習する高度なニューラル ネットワークを探していません。比較的簡単に始めたいので、個々の文字を識別し、それらの文字のピクセルをカウントすることにしました。

2 つの問題があります。

  • 個々のキャラクターの識別。
  • 最も重要なこと:以前にカウントしたピクセルをカウントせずに、接続された (同じ色の) ピクセルをカウントするアルゴリズムが必要です。私には数学の知識がないので、これが私にとって最大の問題です。

ご協力いただければ幸いです。よろしくお願いいたします。

編集:

現在使用しているものなので、この質問を C++ としてタグ付けしました。ただし、疑似コードや別の言語の読みやすいコードでも問題ありません。

役に立ちましたか?

解決

塗りつぶしのアルゴリズムは、限り、あなたが持っているように、含まれるピクセルをカウントするために動作します画像は、単純な白黒のビットマップまでろ過した。

あなたは、あなたのセット内の各文字の標準画像のセットに各文字を比較する類似度を測定して、最高のスコアで文字を選択して文字認識を行うことができることを言ってます。

のためにこの質問をhref="https://stackoverflow.com/questions/25977/how-can-i-measure-the-similarity-between-two-images">

他のヒント

わからないこれは役立ちますが、呼ばれるGPL OCR 11bがあります GOCRするます。

謝罪これは、オフトピックすぎですが、私見ヴィグラ場合には(ない他の1!)にDevILよりもC ++のためにはるかに優れた画像処理ライブラリです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top