我不想知道它说,它不会被处理像一个CAPTCHA任何歪曲,我只是想知道,如果一个的一堆的图像包含任何文本。
结果

这是东西,将一对夫妇空闲Linux服务器上运行,并计划作业将在一天处理了一大批图像多次。搜索结果

一个我想在这个过程中做的事情,是放弃任何映像中的文本。我不介意一些误报,但我想获得尽可能接近百分之零的失败率,当谈到识别与应丢弃尽可能文本图像。

有帮助吗?

解决方案

的Tesseract-OCR 是什么谷歌使用谷歌图书。试试看。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top