在OCR（光学字符识别）之前，您会建议使用哪种软件进行图像增强？ [关闭]

https://stackoverflow.com/questions/142743

02-07-2019
|

题

我们目前正在研究在提交给OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance的Scansoft API（v15）。我们正在研究主要工具，但后来决定寻找其他地方。与Lead Tools相关的许可成本太高了。首先，我们正在寻找简单的图像增强功能，例如：去歪斜，去斑，线移除，打孔去除，锐化等。我们运行的是.NET和Java软件的混合，但首选java解决方案。

解决方案

Kofax有利于预处理，但对于你所谈论的清理类型可能有点过分，除非图像非常糟糕。除非您的专业是图像处理，否则我建议您与提供图像处理和OCR的提供商合作，以便您可以专注于实际添加的值。

我们从ABBYY（ ABBY SDK ）获得OCR开发套件的许可，并且发现它是精湛的图像处理和OCR。 API非常广泛，示例应用程序，帮助和支持令人印象深刻。我绝对建议你去看看。

其他提示

免责声明：我在Atalasoft工作

我们拥有.NET的这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有OCR组件，包括用于Abbyy，Tesseract等的.NET包装器和可搜索的PDF生成（图像在PDF文本的顶部）

不确定这是否符合你们所需的标准，但也许你应该看一下 Paint.Net API。我不知道提取他们的图像处理算法在你的项目中使用是多么容易，但我相信他们会做你正在寻找的一些事情。此外，它是一个带有MIT许可证的开源项目，因此对于商业用途应该非常友好。

在KOFAX.com上研究KOFAX VRS

也许JMagick，它是ImageMagick的开源Java界面。它以瘦Java本机接口（JNI）层的形式实现到ImageMagick API中。它是根据LGPL许可的，所以它不应该是许可证的问题。

http://sourceforge.net/projects/jmagick/

我建议英特尔它的零成本运行时许可。

取决于原始图像的数量和质量。托管代码和映像工具包可以使用，但如果您需要处理数百万个图像，它并不总是最佳解决方案。对于小批量和预算紧张，我同意以前的海报，像 Aforge，Paint.NET 和其他开源计算机视觉库这样的项目可以解决这个问题。当然，如果结果没有改善，那么你就是独立的......至少你可以在一个应用程序中以低成本放置所需的一切。

如果您每月处理数十万张图片，那么我建议您将流程分成较小的工作流程步骤并调整每个图像，直到每张图片的成本尽可能接近零。您会发现OCR结果首先快速上升，然后比您预期的更快地平稳。（我不是OCR的忠实粉丝，但它有它的位置）

我使用来自 Recogniform 的商业Windows产品，在批处理模式下使用针对各种图像调整的脚本在OCR之前处理和清理图像。如果图像未通过QC或被OCR引擎拒绝，则将其“修复”。手动使用使用 Atalasoft的 工具包构建的自定义.NET应用程序。批处理所有内容，只触摸失败的内容。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow