OCR:如何提高准确性存图书馆除非文本的家具'、形状、等等,以避免混淆OCR?

StackOverflow https://stackoverflow.com/questions/2448106

我要删除的长方形等,附上文本的截图像,这样我就可以进行光学字符识别得到准确的案文的截图。

背景:

我这样做是为了从中提取数据的一个遗产应用程序使用的其他应用程序。这是唯一的方法获得这种数据作为相关的文件是在一个封闭的、专有的二元格式。

我将使用AutoItScript驱动的应用程序的数据显示在它的用户界面,然后我将截本和饲料这个魔方.

我已经有了 一些 成功的自动化用户界面,已经能够使用魔方得到平ascii码文本中的位图。

有几个AutoItScripr论坛,文章谈论其使用带有魔方/OCR但不具体地说对于我的问题。http://www.autoitscript.com/forum/index.php?s=6c32c3ece12756e635a619cdf175eff9&showforum=2

我需要做的

有薄,1像素的广泛的矩形,密切合附上一些文字,当送到魔方就看到他们,因为我例如用于垂直线的长方形。

任何想法就如何消除的矩形,或最佳做法?

我要问,如果有一个通用命令行基础的工具,复盖的矩形,例如,在。png文件。然后我可以传递。png通过这个,然后将其传递给魔方.

详情魔方的释放/setup我用如下:

去这里: http://code.google.com/p/tesseract-ocr/downloads/list -为基本的英语通用字符集得到魔方建立和运行,并认识到你的位的文本为ascii码文本,使用tesseract-2.00.eng.tar.gz (目前版本,在编写报告时是:"英语言数据魔方(2.00和最)Jul2007年989KB84845")

相关的问题,我已经看了上堆溢出

在这些,我的问题是完全不回答,或者一个商业解决方案正在出售。我不想要考虑的一个商业解决方案,在这个阶段。

有帮助吗?

解决方案

有可能不会是一个免费的现成解决方案,但编码你自己不应该太困难,因为它可能是安全的假设,一个矩形将永远是一个有效的字符字体的字母,因此可以删除,安全。它还有助于你所有的矩形的边界是一个象素宽。

所以搜索的一个连续的水平线是连接到另一个,平行线一样的长度完全的两个垂直线。重复搜索直到你找到所有形的图像,然后使它们的所有与透明 图形。DrawRectangle钢笔。透明.不呈现一个矩形透明的,直到你完成寻找别的风险擦出的部分重叠的矩形之前,你已经找到他们。这只是一个启动器的建议,我还没有实现,或者调试这种算法。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top