OCR:을 비교하는 방법 이미지,종류 unmatching 고 이렇게 빠른가?

https://stackoverflow.com/questions/574923

05-09-2019
|

문제

관리는 각각의 캐릭터에 저장된 비트맵 이 방법을 찾고 신속하게 확인하는 문자입니다.

그러므로 내가 저장이 가능한 모든 문자 배열로의 1 과 0 그들을 비교의 배열이트맵 나는 그를 잡았습니다.

내가 할 수 있는 간단한 검사를 좋아 비교는 얼마나 많은 검은 픽셀을 내가 가지고,비교하는 차원에 있지만,이러한 모든 검사는 느린(다만 추측..).

그래서 내가 무엇을 찾고있는 방법는 물 모든 픽셀은 아래에서 위 또는 임의로 비교 배열을 설정의 배열 및 분류 unmatching 내까지 단 하나의 배열 남아있다.그러나는 방법을 구현할 수 있는?

당신의 도움을 위한 감사합니다.

Sven

해결책

에 OCR-세계 그 아주 드물게 실행할 것으로"완벽하게 일치"사 targetresource 와 원래의 비교하는 리소스입니다.

실제로 그것은 거대한 분야의 과학이지만,여기에 좋은 논문에서 대상을 제공해야 하는 당신은 몇 가지 기본적인 지식을:http://www.discover.uottawa.ca/~qchen/my_papers/master_thesis.pdf

참고하는 알고리즘과 같은 이들은 매우 수학 중에서 이제는 방법에 대해 최적화된 표준 86CPU.

찾고 있다면 완벽하게 일치하는(내 말은,정말 완벽한,아래 byte-to-byte)그리고 당신이 이것을 구현하려면 빠르고 쉽고,내가 하는 건"skip 명백한 불일치를 빨리"-좀 알고리즘 다음과 같습니다.

1)비교 크기의 배열을,다른 경우,그것은 당신이 무엇을 찾기 위해

2)비교 해시 값의 각각의 비트맵

3)을 비교하고 각 비트/바이트 하나씩로 당신의 차이,그것은 당신이 무엇을 찾기 위해

4)승리,당신이이 일치:)

이것은 매우 느리에 따라,당신이 무엇을 달성하기 위해 노력하고,그러나 쉽게 구현할 수 있으며 그것은 작동합니다.그래서 잘 진행을 위해 시제품에 모두 응용 프로그램.내가 말했듯이,OCR(와 모든 다른 형태의 디지털 신호 처리)는 거대한 분야의 연구,그래서 그것은 무언가를 기대할 수 있습니다 사람들을 가르치에는 빠른 forumpost,슬프게도:(

행운

[편집]을 보고 주석에서 당신의 OQ,내가 말한 것에 대한 hashtable/사전에 큰 데이터 구조를 것이 가장 빠르다.는 것,또는 바이너리 검색 트리..모두 매립 onj 해시-key generator:)

[EDIT2(xD)]"그것의 별명이 텍스트를 컴퓨터에 의해 생성.배경은 다르지만,텍스트를 항상 동일한 색상입니다." 매우 중요한 정보가 있다:P 의 크기는 텍스트/비트맵 항상 같은가?나는 그 중 하나를 구현하 자신의 해싱 알고리즘 어디에 당신이 버리고 미리 설정된 배경 색상이도록 해싱하는 값에 따라 색상의 텍스트(및 모양이 너무 왕왕)또는 단순히 다시 작성한 모든 배경의 픽셀에서 당신의 목표는 것과 동일한 색상으로 원래(또는 그냥 다른 배경하는 대상을?따라에 다시는 데이터는 당신과 싸우고 여기에 필요한 더 많은 정보:)).

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow