ASP.NET에서 PDF 파일을 HTML로 변환하는 가장 좋은 방법은 무엇입니까?

StackOverflow https://stackoverflow.com/questions/277901

  •  07-07-2019
  •  | 
  •  

문제

사용자가 할 일은 컴퓨터에서 PDF 문서를 선택하여 웹 사이트에 업로드하여 웹 사이트에 표시 할 HTML 문서로 변환하는 것입니다. 문서는 변환 후 데이터베이스에 저장됩니다.

PDF를 HTML로 변환하는 가장 좋은 방법은 무엇입니까?

사용자가 "뉴스"스토리를 PDF로 만들고 심프에 업로드하여 HTML로 변환되어 웹 사이트에 표시되는 요구 사항을 전달했습니다.

도움이 되었습니까?

해결책

PDF로 문서를 저장할 수있는 문서 작성 소프트웨어는 HTML로 저장할 수 있습니다. 이 문제는 사용자가 다양한 파일을 초래하는 풍부한 문서 (많은 임베디드 이미지)를 작성할 것이라고 가정하고 있으며, 요구 사항은 이러한 문서를 사용자에게 최대한 간단하게 업로드하려는 욕구에서 비롯됩니다.

아마도 당신을 위해 이것을 할 수있는 수많은 변환 패키지가 있지만, 풍부한 콘텐츠에 대해 이야기 할 때 텍스트와 이미지에 대해 이야기하고 있습니다. 이러한 이미지는 어딘가에 저장되어 어떻게 든 사용해야하며, 사용하는 모든 변환 방법을 사용하려면 모든 이미지 소스를 검사하여 서버의 유효한 위치를 가리 키야합니다.

팀에 가져갈 수있는 대체 방법을 제안하고 싶습니다. 콘텐츠를 게시하기위한 많은 블로그 API 중 하나를 구현합니다. 이 API를 사용하여 Windows Live Writer 및 Microsoft Word와 같은 웹 사이트에 직접 콘텐츠를 게시하는 무료 및 상용 소프트웨어 패키지가 있습니다. 사용자는 단순히 컨텐츠를 작성하여 먼저 PDF로 게시 한 다음 업로드하지 않고도 웹 사이트에 직접 업로드 할 수 있습니다. 따라서 프로세스는 사용자에게 훨씬 부드럽게되며 전환 코드를 개발하거나 구매하는 데 수천 달러를 소비 할 필요가없는 양식으로 게시물을 얻습니다.

가장 일반적인 두 가지 API는입니다 Metaweblog API 그리고 이동식 유형 API. 둘 다 매우 간단하고 구현하기 쉽습니다. 나는 이런 식으로 당신이 생각하는 것보다 훨씬 더 나은 대안이 될 것이라고 생각합니다.

다른 팁

PDF를 HTML 문자열로 변환하는 것이 특히 PDF로 다시 내보내려면 최선의 아이디어라고 생각하지 않습니다. PDF 파일에는 종종 이미지와 같은 이진 요소가 포함되어 있으므로 Base64와 같은 인코딩을 통해 ASCII로 변환하는 것이 가장 좋습니다. 이렇게하면 DB의 텍스트 필드에 저장 한 다음 다시 변환 할 수있는 ASCII 문자열이 있습니다. 주요 요구 사항에 대해 더 많이 확장 할 수 있습니까?

내 추천은 가능하다면 그렇게하지 않는 것입니다 (그러나 우리는 모두 관리자가 어떤지 알고 있습니다) ...

PDF를 HTML로 오르기로 변환하는 것이 좋습니다 (상업용 솔루션을 찾을 수 없기 때문에 이미 언급 된대로 수행하고 인코딩 된 Base64 String 또는 Blob으로 저장하는 것이 좋습니다. 또는 데이터베이스의 다른 바이너리 형식을 한 다음 브라우저 용 PDF보기 플러그인을 사용하여 사용자에게 표시합니다.

"pdf to html"에 대한 간단한 Google 검색뿐만 아니라 : http://www.gnostice.com/pdf2manyoverview_x.asp. 나는 다른 사람들이 있다고 확신합니다.

따라서 '가능'하지만 관리자에게 최고의 콘텐츠 관리 솔루션이 아니라고 설명 할 수 있습니다.

사용하지 않는 이유는 무엇입니까? itextsharp PDF 콘텐츠를 읽으려면? 그런 다음 바이너리 PDF와 텍스트 내용을 데이터베이스에 저장할 수 있습니다. 그런 다음 사용자가 콘텐츠를 검색하고 PDF를 다운로드 할 수 있습니다.

DynamicPDF를 살펴 봐야합니다. 그들은이 목적을 정확하게 제공하기위한 컨버터 (현재 베타)가 있습니다. 우리는 그들의 제품을 큰 성공으로 사용했습니다 (특히 PDF에 직접보고 서비스 보고서를 덤프하기 위해).

ref : http://www.dynamicpdf.com/

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top