문제

반복 형식 패턴의 데이터와 함께 DOCX 형식의 Word 문서가 있습니다.

반복 세트에서 각 데이터를 가져 와서 SQL 테이블의 행으로 업로드하고 싶습니다.

여기에 데이터 샘플 :

Question No : 1
How is LINQ to SQL different from Entities?

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Question No : 2
How is NVARCHAR different from VARCHAR

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

몇 가지 접근 방식을 생각할 수 있습니다.
- 사무실 API를 사용하여 문서를 DOCX로 읽으십시오.
-Word 및 Parse XML에서 XML로 문서를 저장 [변환 된 XML 문서에는 구조/스키마가없는 것 같습니다
- Word and Parse HTML에서 문서를 HTML로 저장 [DOM 구조가 잘 형성되지 않음

위의 어느 쪽을 제안 하시겠습니까? 문서를 변환하고 SQL 테이블로 업로드하거나 DB에 액세스하는 데 도움이되는 도구가 있습니까?

감사!

도움이 되었습니까?

해결책

DOCX는 XML 파일의 ZIP 디렉토리 트리 일뿐입니다. Winzip 또는 7-zip을 사용하여 하위 디렉터 세트로 추출하십시오. 해당 XML 파일을 SQL Server에 업로드하여 파일 이름과 폴더 경로를 추가하십시오. SQL Server XML 메소드 (.NODE 등)를 사용하여 원하는 관계형 형식으로 파쇄합니다.

여기에는 XML 스키마와 구조가 있습니다.

다른 팁

이 파일을 자주 처리하려는 경우 다른 형식으로 저장 (SQL로 처리하기 쉽음) - 일반 텍스트 형식 일 수도 있습니다. 이 프로세스 (이 파일을 DB로 가져 오는)가 정기적으로 수행되는 경우 - 중간 형식으로 변환하지 않고 기본 DOCX 처리로 이동하십시오. Quick Google Search는 DOCX 형식을 데이터베이스에 읽을 수있는 구성 요소가 있음이 밝혀졌습니다 (예 : http://www.brothersoft.com/code-library-for-.net--(sql-server-msde) -22050.html)

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top