OCR para Devanagari (hindi / marathi / sânscrito)
-
21-09-2019 - |
Pergunta
Alguém tem alguma idéia sobre qualquer trabalho recente realizado sobre o reconhecimento óptico de caracteres para scripts indianos usando técnicas modernas de aprendizado de máquina? Conheço algumas pesquisas que estão sendo feitas no ISI, Calcutá, mas nada de novo surgiu nos últimos 3-4 anos, até o melhor de meu conhecimento, e o OCR para Devanagari está infelizmente!
Solução
Isso certamente é velho demais para ser útil, mas é legal: um vídeo dos ingestões falando em sânscrito e OCR. (Daniel Hh Ingalls, Sr., Professor e tradutor sânscrito, e seu filho Dan Ingalls, cientista da computação envolvido com SmallTalk etc.) A primeira metade é Ingalls Sr. descrevendo um projeto para analisar automaticamente o texto, e o segundo é de Ingalls Jr. descrevendo como ele implementou OCR para sânscrito do zero.
Outras dicas
FYI: Há um Artigo no New York Times Desde 2003, referenciando uma ferramenta chamada Ilt.