문제

C #에서 Tesseract의 인터페이스를 사용하여 tiff 파일을 어떻게 OCR합니까?
현재는 실행 파일을 사용하는 방법 만 알고 있습니다.

도움이 되었습니까?

해결책

소스 코드는 실행 파일에 맞게 조정 된 것 같았습니다. 대신 DLL로 빌드되도록 약간의 재 연결이 필요할 수 있습니다.저는 Visual C ++에 대한 경험이 많지 않지만 약간의 연구로 그렇게 어렵지 않을 것이라고 생각합니다.누군가가 이미 라이브러리 버전을 만들었을 수도 있습니다. Google을 사용해보세요.

DLL 파일에 tesseract-ocr 코드가 있으면 Visual Studio를 통해 파일을 C # 프로젝트로 가져 와서 래퍼 클래스를 만들고 모든 마샬링 작업을 수행하도록 할 수 있습니다.가져올 수없는 경우 DllImport 를 사용하여 DLL의 함수를 호출 할 수 있습니다.C # 코드에서.

그런 다음 원본 실행 파일을 살펴보고 TIFF 이미지를 올바르게 OCR하기 위해 호출 할 함수에 대한 단서를 찾을 수 있습니다.

다른 팁

tessnet 살펴보기

C # 프로그램은 tesseract.exe를 시작한 다음 tesseract.exe의 출력 파일을 읽습니다. 라코 디스

오늘 EMGU 에 Tesseract 래퍼가 포함되어 있음을 발견했습니다.opencv lib의 관리되지 않는 dll의 수가 다소 어려울 수 있지만 출력 디렉토리에 대한 빠른 복사가 치료되지 않는 것은 아닙니다.여기에서 실제 OCR 프로세스는 세 줄로 간단합니다. 라코 디스

"로보 매틱스"는 간단하지만 효과적인 방법을 보여주는 매우 멋진 YouTube 동영상 을 모았습니다.솔루션.

면책 조항 : 저는 Atalasoft에서 일합니다.

OCR 모듈은 Tesseract를 지원 하며, 이것이 충분하지 않은 것으로 판명되면더 나은 엔진으로 업그레이드하고 한 줄의 코드 만 변경할 수 있습니다 (여러 OCR 엔진에 대한 공통 인터페이스를 제공합니다).

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top