문제

질문에 대한 승인된 답변 이미지 인식을 위한 C++ 라이브러리:단어를 문자열로 포함하는 이미지 다음을 권장합니다.

  1. 입력 이미지를 300DPI로 확대/축소합니다.

이걸 어떻게 하면 좋을까...저는 DPI가 이미지 형식이 아닌 모니터용이라는 인상을 받았습니다.

도움이 되었습니까?

해결책

나는 여기서 더 정확한 용어가 생각합니다 리 샘플링. 정확한 OCR을 지원할 수있을만큼 높은 픽셀 해상도를 원합니다. 글꼴 크기 (예 : IN 포인트들)는 일반적으로 픽셀이 아닌 길이 단위로 측정됩니다. 72 포인트 = 1 인치이므로 300 dpi ( "픽셀-인치")의 해상도를 위해서는 300/72 픽셀 -point가 필요합니다. 이는 일반적인 12 포인트 폰트가 50 픽셀의 높이 (또는 더 정확하게베이스 라인에서베이스 라인 거리)를 가지고 있음을 의미합니다.

이상적으로, 소스 문서는 주어진 글꼴 크기에 대해 적절한 해상도로 스캔해야하므로 이미지의 글꼴의 높이가 약 50 픽셀입니다. 해상도가 너무 높거나 낮은 경우 그래픽 프로그램을 사용하여 이미지를 쉽게 재편성 할 수 있습니다 (예 : ). 다음과 같은 그래픽 라이브러리를 통해 프로그래밍 방식 으로이 작업을 수행 할 수 있습니다. Imagemagick 많은 프로그래밍 언어에 대한 인터페이스가 있습니다.

다른 팁

DPI는 픽셀 단위의 이미지를 그림 크기의 물리적 장치와 연결할 때마다 의미가 있습니다.OCR의 경우 일반적으로 스캔 해상도를 의미합니다.스캔의 각 인치마다 몇 개의 픽셀을 얻을 수 있습니까?12포인트 글꼴은 한 줄에 12/72인치로 인쇄되도록 되어 있으며 대문자는 그 크기의 약 80%를 채울 수 있습니다.따라서 300DPI로 스캔하면 높이는 약 40픽셀이 됩니다.

많은 이미지 형식에는 DPI가 기록되어 있습니다.이미지가 스캔된 경우 이는 스캐너의 정확한 설정이어야 합니다.디지털 카메라에서 가져온 경우 항상 EXIF ​​사양에서 요구하는 기본값인 72 DPI로 표시됩니다.카메라는 이미지의 원본 크기를 알 수 없기 때문입니다.이미징 프로그램을 사용하여 이미지를 생성할 때 DPI를 임의의 값으로 설정할 수 있는 기회가 있을 수 있습니다.이는 최종 이미지 사용 방법을 지정하는 데 편리하며 이미지에 포함된 세부 사항과는 아무런 관련이 없습니다.

다음은 이미지 크기 조정에 대한 세부 정보를 묻는 이전 질문입니다.이미지의 고품질 크기 조정을 수행하려면 어떻게 해야 합니까?

OCR 소프트웨어는 일반적으로 "정상"글꼴 크기로 작동하도록 설계되었습니다. 이미지 관점에서 볼 때, 이것은 아마도 30 ~ 100 픽셀 높이 범위의 문자를 찾고 있음을 의미합니다. 훨씬 높은 해상도의 이미지는 OCR 소프트웨어가 효율적으로 처리하기에는 너무 큰 글자를 생성 할 것입니다. 마찬가지로, 해상도가 낮은 이미지는 소프트웨어가 문자를 인식하기에 충분한 픽셀을 제공하지 않습니다.

"어떻게해야합니까? 나는 DPI가 이미지 형식이 아니라 모니터에 대한 인상을 받았다."

DPI는 인치당 도트를 나타냅니다. 모니터와 어떤 관련이 있습니까? 글쎄, 우리는 3 개의 RGB 서브 픽셀로 만든 픽셀을 가지고 있습니다. DPI가 높을수록 해당 공간에 더 자세히 설명합니다.

DPI는 디스플레이 및 인쇄물에 유용한 측정 값이지만 유용한 것은 없습니다. 실제로 이미지 형식 자체에는 아무것도 없습니다.

DPI가 일부 형식으로 태그가 지정되는 이유는 장치에 해당 해상도에 표시되도록 지시하지만 내가 이해 한 바에 따르면 사실상 그 명령을 무시하고 특정 출력에 대한 이미지를 최적화하는 데 최선을 다합니다.

이미지 형식으로 72 dpi를 1 dpi 또는 6000 dpi로 변경할 수 있으며 모니터에서는 차이가 없습니다. "Upsize/Downsize to 300 dpi"는 의미가 없습니다. 리 샘플링은 DPI도 변경되지 않습니다. Photoshop에서 시도해보십시오. DPI를 변경할 때 "Respample"을 선택 취소하면 차이가 없습니다. 점점 커지지 않을 것입니다.

DPI는 이미지 형식 인 IMO에 대해 완전히 의미가 없습니다.

목표가 OCR 인 경우 DPI는 원래 스캔 된 문서의 각 인치에 대한 이미지의 도트 수로 의미가 있습니다. DPI가 너무 낮 으면 정보가 영원히 사라지고 Bicubic 보간조차도 회복하는 훌륭한 작업으로 가지 않습니다. DPI가 너무 높으면 비트를 버리기 쉽습니다.

일을 끝내기 위해; 나는 netpbm/pbmplus 도구 세트의 열렬한 팬입니다. 시작하는 도구는 IS입니다 pnmscale, 비트 맵이 있다면 관련 도구를 고려하고 싶습니다. pbmreduce.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top