Frage

Gute Nacht:)

Ich spiele zur Zeit mit der Teufel-Bibliothek, die mir Bild zu laden in ermöglicht und RGB-Werte pro Pixel prüfen. So wie ein persönliches Lernprojekt, ich versuche, ein sehr einfaches OCR-System für ein paar Bilder schreiben ich mich in Photoshop.

Ich bin erfolgreich in der Lage, alle Verzerrungen im Bild zu entfernen, und ich bin mit Text und Zahlen links. Ich suche zurzeit nicht für ein erweiterte neuronale Netzwerk, das von der Eingabe erfährt. Ich mag relativ leicht beginnen und so habe ich mich daran, die einzelne Zeichen zu identifizieren und die Pixel in diesen Zeichen zu zählen.

Ich habe zwei Probleme:

  • Die Identifizierung der einzelnen Zeichen.
  • Am wichtigsten ist: Ich habe einen Algorithmus muß verbundene Pixel (die gleichen Farbe) zu zählen, ohne Pixel zu zählen ich vorher gezählt habe. Ich habe keinen mathemathical Hintergrund so dies das größte Problem für mich.

Jede Hilfe in dieser Angelegenheit sehr geschätzt wird, danke.

edit:

Ich habe diese Frage als C ++ markiert, weil das ist, was ich bin derzeit mit. Allerdings Pseudo-Code oder leicht lesbarer Code aus einer anderen Sprache ist auch in Ordnung.

War es hilfreich?

Lösung

Die Flußfüllen Algorithmus zum Zählen der eingeschlossenen Pixel arbeiten, solange Sie haben die Bilder, die auf einfache schwarz-weiß-Bitmaps gefiltert nach unten.

gesagt haben, dass Sie die Zeichenerkennung durch Vergleichen jedes Zeichen in eine Reihe von Standard-Bilder von jedem Zeichen in Ihrem Set durchführen kann, die Messung der Ähnlichkeit, und dann mit der höchsten Punktzahl den Charakter wählen.

Hier finden Sie aktuelle diese Frage weitere Informationen.

Andere Tipps

Nicht sicher, das hilft, aber es gibt eine GPL OCR lib genannt gocr .

Entschuldigt, wenn diese zu weit vom Thema, aber IMHO Vigra (nicht der andere!) ist eine viel bessere Bildverarbeitungsbibliothek für C ++ als DevIL.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top