質問

私は現在、Finereader 11 SDK を使用した小さなプロジェクトに取り組んでいます。結果を改善するために、私はアドホック辞書を使用することを好みます。辞書の内容は特定の行の最初の単語に基づいています

例:

Samsung Galaxy S3 ... many other word in this line
Apple Iphone 4 ... much more words
some more lines

私のアイデアは、最初の単語 (Samsung または Apple) を認識し、最初の単語に基づいて考えられるすべての単語で辞書を埋めることです (Samsung の場合:ギャラクシー、S3、...)

Finereader でこれを解決する方法があれば教えてください

よろしく

役に立ちましたか?

解決

ご説明いただきありがとうございます。したがって、私の意見では、あなたができることは次のとおりです。これは FineReader 製品ラインに当てはまりますが、もちろん SDK では API を介してより具体的な制御が可能です。

FineReader OCR には次の辞書があります。

  • 内蔵辞書 - 一般的な単語とそのバリエーションの大規模なセット。ABBYY OCR テクノロジーの強みの 1 つです。たとえば、「Samsung」や「S3」などの特殊な単語は含まれません。一般的な言語を選択すると、その言語の内蔵辞書が自動的に有効になります。

  • カスタム辞書 - これは、構築して単独で、または組み込み辞書と組み合わせて使用​​できる辞書です。

したがって、あなたのプロジェクトでは、フレーズに標準的な英語の単語が含まれている可能性があるため、組み込みの辞書を使用するのが理にかなっていると思います(私が見ることができる完全なフレーズは提供されていないので、これは自分で決定してください)。

また、ブランドやモデルなどを含むカスタム辞書を作成する必要があると強く信じています。もしあなたにその選択肢があり、そう思うなら。共通言語ルールでは文字と数字を混合すべきではないことが示されているため、特に「S3」などの不自然な単語の認識が大幅に向上します。これはとても簡単です。

現時点では、各行を個別の辞書で読むメリットはわかりません。ただし、異なる行に適用できる非常によく似た単語の集合があり、それらの単語を各行に関連付けて個別の辞書に置きたい場合は別です。次に、個別の辞書を作成し、最初の単語に基づいて二次認識を行うために各辞書をオンにすることができます。ただし、これを実現するには、最初に (メモリ内で、または実際に画像をトリミングして) 行に分割し、それぞれを固有の辞書で個別に処理できるようにする必要があります。これは、相当な作業量を伴う SDK でのみ可能です。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top