我想建立一个应用程序,通过一个OCR库,应该扫描图片中提取的文字。

什么Java库我应该使用?

有帮助吗?

解决方案

不知道它有多好(这肯定需要先进行培训),但的罗恩Cemer的Java OCR库

其他提示

如果你正在寻找一个非常可扩展选项,或有一个特定的问题域,你可以考虑使用 Java对象滚动自己定向神经引擎

我用它成功地在个人项目,以确定从图像信诸如 ,你可以找到所有我在github上,这里应用的OCR组件的源

试着魔方 结帐,这篇文章 http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html 和这个例子 http://code.google.com/p/mezzofanti/

编辑:一些更多的事实 -魔方是一个最好的开放源OCR使用的谷歌 -没有训练数据可用于许多语言 -mezzofanti是一个机器应用程序,使用魔方 -要注意:OCR并使用了大量的CPU力。试图OCR一个A4页上有你的T-暴民G1将需要大量的时间和结果可能不你留下深刻的印象;-)

您可以使用谷歌从文档的OCR功能。 检查的文档列表数据API HTTP: //code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top