任何人都不会知道的一c++图书馆采取的图像,并进行图像识别在这这样,它可以找到字母的基础上给予字和/或字体高度?甚至一个这不会让你选择某个字体将是很好的,(例如:readLetters(图像的图像)。

有帮助吗?

解决方案

我已经找到这个很多最近。你最好只是魔方.如果你需要布局分析上的OCR比去Ocropus(这反过来使用魔方做OCR)。布局分析指的是能够检测到位置的文本上的图像和喜欢做的事情的线路分割、块分割,等等。

我已经找到了一些很好的建议,通过试验魔方是值得分享。基本上我已经做了大量的预处理的图像。

  1. 增加/减少输入图像的到300dpi。
  2. 删除颜色的图像。灰度是好的。我实际使用的抖动的阈值,使我输入黑色和白色。
  3. 削减了不必要的垃圾从你的形象。所有三个以上我使用的netbpm(a设置的图像处理工具,用于unix)获得点我几乎100%的精确度为什么我需要的。

如果你有一个高度定制的字体,并与魔方独自一人你要"训练"系统--基本上是你要养活一大堆的培训的数据。这是很好的记载在魔方ocr的网站。你基本上是创建一个新的"语言"对于你的字体,并通过它在用-l的参数。

其他培训机构的我发现是与Ocropus使用nueral网(bpnet)的培训。它需要大量输入数据建立一个良好的统计模型。

在条款的援引魔方/Ocropus都C++。这不会是简单的ReadLines(Image),但有一个API你可以检查出来。你也可以援引通过命令行。

其他提示

虽然我不能推荐一个特别你正在寻找的术语是OCR(光学字符识别)。

有是的tesseract-OCR 其是专业的库来做到这一点。

从那里网站

  

在超正方体OCR引擎是在1995年的精度UNLV测试前3发动机之一。 1995年至2006年间,它已很少的工作就可以完成,但它可能是最准确的开源的一个可用的OCR引擎

我想你想的是猜想。曾经是libgocr项目。我没有使用过了几年,但它使用的,如果你设置了一键是非常可靠的。

超正方体OCR库给出相当准确的结果,它的一个C和C ++库。 我的初步结果约80%的准确,但应用上的图像前处理OCR在供给前的结果是大约95%的准确。 什么是预预处理:

1)二值化所述位图(B&W为我工作更好)。 怎么可能

完成

2)重采样图像为300 dpi

3)的无损格式保存图像,诸如LZW TIFF或CCITT组4 TIFF。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top