Domanda

Ho un documento word in formato DOCX con i dati nel ripetere modello di formato.

desidero prendere ogni dati dal ripetendo impostare e caricare una riga nella tabella SQL.

Esempio di dati qui:

Question No : 1
How is LINQ to SQL different from Entities?

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Question No : 2
How is NVARCHAR different from VARCHAR

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

mi veniva in mente alcuni approcci:
- Leggere il documento come docx utilizzando l'Ufficio API
- Salvare il documento in formato XML da Word e analizzare XML [il documento XML convertito non sembra avere una struttura / schema]
- Salvare il documento in formato HTML da Word e analizzare HTML [struttura DOM non ben formato]

Quale tra sopra suggeriresti e perché? Ci sono strumenti per contribuire a convertire un documento e caricare su un tavolo di SQL o l'accesso DB?

Grazie!

È stato utile?

Soluzione

DOCX è solo un albero di directory ZIP di file XML. Utilizzare WinZip o 7-Zip per estrarlo in una serie di sottodirectory. Caricate i file XML di SQL Server, aggiungendo il loro nome di file e il percorso della cartella. l'uso dei metodi XML di SQL Server (.node, ecc) a loro brandello nella forma relazionale che si desidera.

Si noti che questi hanno schemi e strutture XML.

Altri suggerimenti

Se avete intenzione di elaborare questi file non molto spesso, allora direi salvarlo in un formato diverso (più facile da lavorare da SQL) - forse anche un formato di testo normale. Se questo processo (di importazione del file di DB) sta per essere eseguita su base regolare - andare per il trattamento DOCX nativa senza convertirlo in un formato intermedio. Rapida ricerca su Google ha rivelato che ci sono componenti disponibili che possono leggere in formato docx in un database (ad esempio, http://www.brothersoft.com/code-library-for-.net- (sql-server-MSDE) -22050.html )

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top