문제

잘 자 :)

현재 이미지를로드하고 픽셀 당 RGB 값을 확인할 수있는 Devil Library를 사용하고 있습니다. 개인 학습 프로젝트와 마찬가지로 저는 Photoshop에서 제가 만든 몇 가지 이미지에 대해 매우 기본적인 OCR 시스템을 작성하려고합니다.

이미지의 모든 왜곡을 성공적으로 제거 할 수 있으며 텍스트와 숫자가 남아 있습니다. 나는 현재 입력에서 배우는 고급 신경망을 찾고 있지 않습니다. 비교적 쉽게 시작하고 싶기 때문에 개별 문자를 식별하고 해당 캐릭터의 픽셀을 세기 시작했습니다.

두 가지 문제가 있습니다.

  • 개별 문자를 식별합니다.
  • 가장 중요한 것은 이전에 계산했던 픽셀을 계산하지 않고 연결된 픽셀 (동일한 색상)을 계산하기위한 알고리즘이 필요합니다. 나는 수학적 배경이 없으므로 이것이 가장 큰 문제입니다.

문제에 대한 도움을 주셔서 감사합니다. 감사합니다.

편집하다:

이 질문을 C ++로 태그했습니다. 왜냐하면 그것이 내가 현재 사용하고있는 것이기 때문입니다. 그러나 다른 언어의 의사 코드 또는 쉽게 읽을 수있는 코드도 괜찮습니다.

도움이 되었습니까?

해결책

그만큼 홍수 채우기 알고리즘은 이미지가 단순한 흑백 비트 맵으로 필터링 된 한 포함 된 픽셀을 계산하는 데 작동합니다.

말하면, 각 캐릭터를 세트의 각 문자의 표준 이미지 세트와 비교하여 유사성을 측정 한 다음 점수가 가장 높은 캐릭터를 선택하여 캐릭터 인식을 수행 할 수 있습니다.

보세요 이 질문 자세한 내용은.

다른 팁

이것이 확실하지 않지만 GPL OCR LIB가 호출됩니다. 고유.

이것이 너무 멀지 않은 경우 사과하지만 IMHO 비그라 (다른 하나는 아닙니다!)는 악마보다 C ++를위한 훨씬 더 나은 이미지 처리 라이브러리입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top