我们目前正在研究在提交给OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance的Scansoft API(v15)。我们正在研究主要工具,但后来决定寻找其他地方。与Lead Tools相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜,去斑,线移除,打孔去除,锐化等。我们运行的是.NET和Java软件的混合,但首选java解决方案。

有帮助吗?

解决方案

Kofax有利于预处理,但对于你所谈论的清理类型可能有点过分,除非图像非常糟糕。除非您的专业是图像处理,否则我建议您与提供图像处理和OCR的提供商合作,以便您可以专注于实际添加的值。

我们从ABBYY( ABBY SDK )获得OCR开发套件的许可,并且发现它是精湛的图像处理和OCR。 API非常广泛,示例应用程序,帮助和支持令人印象深刻。我绝对建议你去看看。

其他提示

免责声明:我在Atalasoft工作

我们拥有.NET的这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有OCR组件,包括用于Abbyy,Tesseract等的.NET包装器和可搜索的PDF生成(图像在PDF文本的顶部)

不确定这是否符合你们所需的标准,但也许你应该看一下 Paint.Net API。我不知道提取他们的图像处理算法在你的项目中使用是多么容易,但我相信他们会做你正在寻找的一些事情。此外,它是一个带有MIT许可证的开源项目,因此对于商业用途应该非常友好。

在KOFAX.com上研究KOFAX VRS

也许JMagick,它是ImageMagick的开源Java界面。它以瘦Java本机接口(JNI)层的形式实现到ImageMagick API中。它是根据LGPL许可的,所以它不应该是许可证的问题。

http://sourceforge.net/projects/jmagick/

我建议英特尔它的零成本运行时许可。

取决于原始图像的数量和质量。托管代码和映像工具包可以使用,但如果您需要处理数百万个图像,它并不总是最佳解决方案。对于小批量和预算紧张,我同意以前的海报,像 Aforge,Paint.NET 和其他开源计算机视觉库这样的项目可以解决这个问题。当然,如果结果没有改善,那么你就是独立的......至少你可以在一个应用程序中以低成本放置所需的一切。

如果您每月处理数十万张图片,那么我建议您将流程分成较小的工作流程步骤并调整每个图像,直到每张图片的成本尽可能接近零。您会发现OCR结果首先快速上升,然后比您预期的更快地平稳。 (我不是OCR的忠实粉丝,但它有它的位置)

我使用来自 Recogniform 的商业Windows产品,在批处理模式下使用针对各种图像调整的脚本在OCR之前处理和清理图像。如果图像未通过QC或被OCR引擎拒绝,则将其“修复”。手动使用使用 Atalasoft的 工具包构建的自定义.NET应用程序。批处理所有内容,只触摸失败的内容。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top