문제

ScanSnap 용 ABBYY FineReader는 스캔 한 PDF 파일을 두 개로 사용합니다. 소프트웨어는 원래 PDF 이미지를 유지합니다. PDF 파일 크기 Pre-OCR 및 Post-OCR은 거의 동일합니다.

소프트웨어가 완료되면 모든 PDF 이미지가 Acrobat X에서 앤티 앨리어스가 나타납니다. 페이지 탐색이 이전보다 훨씬 느리고 확대 / 축소 될 때 이미지는 먼저 앤티 앤티 앨리어싱처럼 보입니다. 앤티 앨리어스 이미지로 빠르게 변경하기 전에 버전.

left : 스캔 한 pdf / 오른쪽 : ABBYY와 함께 OCR 후 여기에 이미지 설명

앤티 앨리어싱이없는 원본 이미지를 얻고 싶습니다. 흥미롭게도 Photoshop의 앤티 앨리어스 PDF에서 단일 페이지를 열면 앤티 앨리어싱이 없으며 이미지는 왼쪽에 표시됩니다.

제한된 PDF 프로그래밍 경험은 ABBYY가 OCR 처리 중에 각 이미지에 대해 일종의 anti-alias 플래그를 설정할 가능성이 높다고 믿게합니다. 이 플래그를 설정 해제하려면 어떻게합니까?

유용한 아이디어에 대한 모든 포인터가 많이 알 수 있습니다.

도움이 되었습니까?

해결책

OCR-ED 버전의 이미지 사전에 /Interpolate true 항목이 있으며, 이는 '앤티 앨리어싱'이 발생합니다.JPEG 압축 대신 jpeg2000이 아닌 jpeg2000이 느려지 지 여부는 큰 파일을 확인합니다.

이 키를 설정하지 않으려면 파일을 만드는 동안 꺼내는 것입니다. 가능하지 않은 경우 적절한 언어로 작은 프로그램을 작성하고 실행하려면

그러나 파일이 스포츠의 압축 된 개체 '와 불쾌한 키가 파일 내부의 일반보기에 있기 때문에'일자리 완료 '의 정신으로 파일을 처리 할 수 있습니다.다음과 같이 :

perl -M-encoding -0777pe "s!/Interpolate true!' 'x17!ge" <in.pdf >out.pdf
.

다른 팁

소프트웨어가 완료되면 모든 PDF 이미지가 Acrobat X에서 앤티 앨리어스가 나타납니다. 페이지 탐색이 이전보다 훨씬 느리고 확대 / 축소 될 때 이미지는 먼저 앤티 앤티 앨리어싱처럼 보입니다. 앤티 앨리어스 이미지로 빠르게 변경하기 전에 버전.

실제로 원본 파일에서 2013_11_15_22_51_31.pdf ocr 동안 JPEG 이미지가 들어 있습니다. 'ed 파일 2013_11_15_22_51_31_cr.pdf jpeg2000 이미지가 들어 있습니다.

타사 시청자에서 비교하면 OCR의 이미지의 이미지가 본질적으로 anti-allias'ed되지 않음이 분명해진다. 또한 PDF 시청자가 JPEG2000 이미지에 앤티 앨리어싱을 적용하는 PDF 지시에 명백한 플래그가 없습니다. 따라서 Adobe Reader는 자동으로 JPEG 및 JPEG2000 이미지를 다르게 렌더링하고, 앤티 앨리어싱을 후자에 적용하지만 이전에는 앤티 앨리어싱을 적용하는 것으로 보인다.

두 이미지를 모두 상세하게 비교하지만,이 이미지는 동일하지 않지만 OCR의 PDF의 이미지가 약간 회전되었음을 명확하게합니다.

ABBYY FineReader가 원래 스캔 한 이미지가 올바르게 지향되지 않았 음을 인식했다고 가정합니다. 따라서이 방향을 수정하기 위해 약간 회전했습니다.

OCR의 버전의 이미지를 원래 버전으로 대체하는 것은 옵션이 아닙니다. 회전으로 인해 OCR 정보가 부분적으로 부분적으로 다소 꺼집니다.

시도하고 싶을 수있는 것은 JPEG2000 이미지를 JPEG로 다시 코드하고 OCR의 이미지를 REDODED 버전으로 바꾸는 것입니다. 이것은 약간의 품질의 상실을 의미하지만,이 방법으로 앤티 앨리어싱을 제거 할 수 있습니다.

JPEG2000 이미지가 회전을 위해 accomodate

jpeg 이미지보다 약간 크게 큽니다.

추신 : @Vadimr가 지적했듯이, 파일을 볼 때 누락 된 OCR-ed 버전의 이미지 사전에 실제로 / 보간 진입이 있습니다. 이것은 렌더링을 늦추는 주요 문제가되지 않습니다.

원래 JPEG

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top