Question

J'ai un document Word en format docx avec des données en répétant modèle de format.

Je voudrais prendre chaque donnée de la répétition et de télécharger à mettre une ligne dans la table SQL.

Exemple de données ici:

Question No : 1
How is LINQ to SQL different from Entities?

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Question No : 2
How is NVARCHAR different from VARCHAR

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Je ne pouvais penser à quelques approches:
- Lire le document docx en utilisant l'API Bureau
- Enregistrez le document au format XML de Word et analyser XML [le document XML converti ne semble pas avoir une structure / schéma]
- Enregistrez le document en HTML à partir de Word et analyser HTML [structure DOM pas bien formé]

qui, entre ci-dessus proposeriez-vous et pourquoi? Y a-t-il des outils pour aider à convertir un document et télécharger sur une table SQL ou un accès DB?

Merci!

Était-ce utile?

La solution

DOCX est juste un arbre répertoire postal de fichiers XML. Utilisez WinZip ou 7-Zip pour extraire un ensemble de sous-répertoires. Téléchargez ces fichiers XML à SQL Server, en ajoutant leur nom de fichier et le chemin du dossier. l'utilisation des méthodes XML SQL Server (.node, etc) pour les déchiqueter dans la forme relationnelle que vous voulez.

Notez que ceux-ci ont des schémas XML et les structures.

Autres conseils

Si vous allez traiter ces fichiers pas très souvent, alors je dirais que l'enregistrer dans un format différent (plus facile à traiter par SQL) - peut-être même un format de texte brut. Si ce processus (d'importer ce fichier DB) va être effectuée sur une base régulière - aller pour le traitement natif DOCX sans le convertir en un format intermédiaire. Recherche rapide Google a révélé qu'il existe des composants disponibles qui peuvent lire le format docx dans une base de données (par exemple http://www.brothersoft.com/code-library-for-.net- (SQL-server-msde) -22050.html )

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top