DOT NET : 제목으로 각 기사를 얻으려면 PDF 파일을 구문 분석해야합니까?

StackOverflow https://stackoverflow.com/questions/1058208

문제

각 기사의 제목과 그 설명을 식별 할 수 있도록 PDF 파일을 구문 분석하고 싶습니다. 검색 목적을 위해 제목 텍스트와 DescriptionText를 저장할 수 있습니다.이를위한 라이브러리 나 도구가 있습니까?

도움이 되었습니까?

해결책

먼저 설치할 수 있습니다 Adobe PDF Ifilter DLL. 그런 다음 .pdf 파일에서 속성을 읽을 수 있습니다. 이 도서관 (C#에서 ifilter 사용). 또는 또는 당신은 또한 조사 할 수도 있습니다 이 도서관 (ifilter를 사용하여 다양한 파일 내용을 추출하기 위해 TexTreader를 구현).

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top