OCR para Devanagari (hindi / marathi / sânscrito)

https://stackoverflow.com/questions/2078800

21-09-2019
|

Pergunta

Alguém tem alguma idéia sobre qualquer trabalho recente realizado sobre o reconhecimento óptico de caracteres para scripts indianos usando técnicas modernas de aprendizado de máquina? Conheço algumas pesquisas que estão sendo feitas no ISI, Calcutá, mas nada de novo surgiu nos últimos 3-4 anos, até o melhor de meu conhecimento, e o OCR para Devanagari está infelizmente!

Solução

Isso certamente é velho demais para ser útil, mas é legal: um vídeo dos ingestões falando em sânscrito e OCR. (Daniel Hh Ingalls, Sr., Professor e tradutor sânscrito, e seu filho Dan Ingalls, cientista da computação envolvido com SmallTalk etc.) A primeira metade é Ingalls Sr. descrevendo um projeto para analisar automaticamente o texto, e o segundo é de Ingalls Jr. descrevendo como ele implementou OCR para sânscrito do zero.

Outras dicas

FYI: Há um Artigo no New York Times Desde 2003, referenciando uma ferramenta chamada Ilt.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow