Frage

Ich will nicht wissen, was sie sagt, und es wird nicht mit einer Verzerrung wie ein CAPTCHA zu tun haben, ich will nur wissen, ob ein Bündel von Bildern enthalten einen beliebigen Text.

Dies ist etwas, das auf ein paar Leerlauf Linux-Servers ausgeführt werden soll, und ein Cron-Job wird einen großen Stapel von Bildern mehrmals am Tag verarbeiten.

Eines der Dinge, die ich in dem Prozess machen will, ist keine Bilder mit Text in ihnen verwerfen. Ich weiß nicht, einige Fehlalarme dagegen, aber ich möchte so nah an einer Null-Prozent bekommen Rate fehlschlagen, wenn es darum geht, Bilder mit Text zu identifizieren, die wie möglich entsorgt werden sollte.

War es hilfreich?

Lösung

Die Tesseract-OCR ist, was Google für Google Books nutzen. Probieren Sie es aus.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top