Frage

Ich arbeite derzeit an einem Projekt und mein Ziel ist es, Text in einem Bild zu finden.Es ist noch nicht meine Absicht, den Text mit OCR zu versehen.Ich möchte grundsätzlich die Textgrenzen innerhalb eines Bildes ermitteln.Ich verwende die AForge.Net-Bildkomponente zur Manipulation.Irgendeine Hilfe in der einen oder anderen Hinsicht?

Update 05.02.09:Seitdem bin ich in meinem Projekt einen anderen Weg gegangen.Allerdings habe ich versucht, Text mit MODI (Microsoft Office Document Imaging) zu erhalten.Es ermöglicht Ihnen, ein Bild mit OCR zu scannen und ganz einfach Text daraus zu extrahieren.

War es hilfreich?

Lösung

Dies ist ein aktives Forschungsgebiet.Es gibt buchstäblich Unmengen wissenschaftlicher Arbeiten zu diesem Thema.Es wird schwierig sein, Ihnen Hilfe zu geben, insbesondere ohne weitere Details.Suchen Sie nach bestimmten Textsorten?Schriftarten?Nur Englisch?Sind Sie mit der wissenschaftlichen Literatur vertraut?

„Texterkennung“ ist ein Standardproblem in jedem OCR-System (optische Zeichenerkennung) und daher gibt es im Internet viele Codefragmente, die sich damit befassen.

Ich könnte anfangen, haufenweise Links von Google aufzulisten, aber ich schlage vor, dass Sie einfach nach „Texterkennung“ suchen und mit dem Lesen beginnen :).Es gibt auch reichlich Beispielcode.

Andere Tipps

Das Erkennen von Text in einem Bild ist in der Tat ein heißes Thema für Forscher auf diesem Gebiet, geriet jedoch erst damals außer Kontrolle Captchas wurde zur „Norm“ im Hinblick auf die Abwehr von Spam-Bots.Warum Captchas als Schutz verwenden?Nun, weil es sehr schwierig ist/war, Text in einem Bild zu finden (und zu lesen)!

Der Grund, warum ich Captchas erwähne, liegt darin, dass die meisten Fortschritte* in diesem winzigen Bereich gemacht werden und ich denke, dass Ihre Lösung dort am besten zu finden ist.Vor allem, weil es bei Captchas tatsächlich darum geht, Text (oder etwas, das Text ähnelt) in einem überfüllten Bild zu finden und anschließend zu versuchen, die Buchstaben richtig zu lesen.

Also wenn du dich selbst finden kannst ein gutes Open-Source-Tool zum Brechen von Captchas Sie haben wahrscheinlich alles, was Sie brauchen, um Ihre Suche fortzusetzen ...
Sie könnten wahrscheinlich sogar den schwierigsten Code, der die Zeichenerkennung selbst verwaltet, wegwerfen, da diese OCRs zum Lesen verzerrter Texte verwendet werden, was Sie nicht tun müssen.

*:Fortschritt in Bezug auf sichtbare, nutzbare und praktisch Informationen für einen „Nichtforscher“

Wenn Sie mit der Verwendung einer Online-API einverstanden sind, finden Sie die API unter http://www.wisetrend.com/wisetrend_ocr_cloud.shtml kann zusätzlich zur reinen OCR auch eine Texterkennung durchführen.

Konturbreitentransformation kann das für Sie tun.Das ist zumindest das, was MS für sein Mobiltelefon-Betriebssystem entwickelt hat.Eine Diskussion über die Umsetzung ist hier bei https://stackoverflow.com/

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top