Domanda

Ho cercato in giro per l'open source OCR per il cinese. Ma senza alcuna fortuna sembra raramente essere qualche open source OCR (per il cinese) che sono utilizzabili.

Così sto qui a chiedermi:

  1. C'è un open source OCR per il cinese che potrebbe essere utilizzato per ambiente di produzione?

  2. Qual è le principali differenze in sede di attuazione di un OCR per il latino-lingue e per il cinese? So che qualche buon OCR come Tesseract o OCRopus, che cosa devo fare se voglio farlo cinese di sostegno?

Ogni aiuto è apprezzato e grazie in anticipo ~

È stato utile?

Soluzione

È possibile scegliere:

  • Tesseract 3.0 sostegno cinese / giapponese
  • NHOCR giapponese di supporto

Altri suggerimenti

cinese ha di gran lunga più caratteri di lingue latine. Ci sono alcuni prodotti commerciali. Uno dei modi è quello di contattarli e chiedere aiuto.

Non credo che ci sia un open source per i caratteri cinesi o giapponesi. Nella zona di OCR, ci sono un sacco di tecniche di là degli algoritmi di pattern recognition, in cui una società è bravo, non la comunità open source.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top