Целостный алгоритм распознавания слов в деталях
Вопрос
Где я могу найти детали алгоритма для целостного распознавания слов? Мне нужно построить простую систему OCR в оборудовании (на самом деле FPGA), и научные журналы кажутся такими абстрактными?
Есть ли какие -либо коды с открытым исходным кодом (открытое ядро) для целостного распознавания слов?
Спасибо
Решение
Для алгоритма, который вполне подходит для реализации FPGA (смущающе параллельно), вы можете посмотреть:
http://en.wikipedia.org/wiki/cross-correlation
Это быстро и легко реализуется.
Единственное, что это: он распознает форму (в вашем случае, какой -то текст), зависимый от вращения, размера / растяжения / перекоса и т. Д. Но если это не проблема, это может быть очень быстро и довольно надежна. Вы должны следить за проблемами интерпретации с похожими персонажами (например, O и C).
Я использовал его, чтобы найти тексты по умолчанию на сканированных формах для получения подшипников, где область интересов и поиска на этих изображениях (6 млн пикселей) заняло всего 15 мс с нашей реализацией на процессоре Core2 в одном потоке.