سؤال

لدي مستند Word بتنسيق Docx مع البيانات في نمط تنسيق التكرار.

أرغب في أخذ كل بيانات من مجموعة متكررة وتحميلها إلى صف في جدول SQL.

عينة من البيانات هنا:

Question No : 1
How is LINQ to SQL different from Entities?

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

Question No : 2
How is NVARCHAR different from VARCHAR

A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1

Answer : D
Explanations : 
Some explanation.

يمكن أن أفكر في عدد قليل من الأساليب:
- اقرأ المستند كوسع باستخدام Office API
- احفظ المستند ك XML من Word وتحليل XML [مستند XML المحول لا يبدو أن لديه هيكل / مخطط
- احفظ المستند ك HTML من Word وتحليل HTML [هيكل DOM غير متشكل بشكل جيد

أي ما سبق تقترح ولماذا؟ هل هناك أي أدوات للمساعدة في تحويل مستند وتحميل إلى جدول SQL أو الوصول إلى DB؟

شكرا!

هل كانت مفيدة؟

المحلول

Docx هو مجرد شاشة ZIP DIVELY من ملفات XML. استخدم WinZip أو 7 zip لاستخراجها إلى مجموعة من الدلائل الفرعية. قم بتحميل ملفات XML تلك إلى SQL Server، مما يضيف اسم الملف ومسار المجلد. استخدم أساليب SQL Server XML (.Node، إلخ) لتمزيقها في النموذج العلائقي الذي تريده.

لاحظ أن هذه لديها مخططات و هياكل XML.

نصائح أخرى

إذا كنت ستقوم بمعالجة هذه الملفات في كثير من الأحيان، فأنا أقول حفظها بتنسيق مختلف (أسهل في معالجة SQL) - ربما حتى تنسيق نص عادي. إذا كانت هذه العملية (من استيراد هذا الملف إلى DB)، فسيتم تنفيذها على أساس منتظم - اذهب لمعالجة DocX الأصلية دون تحويلها إلى تنسيق متوسط. كشف بحث Google السريع أن هناك مكونات متوفرة يمكنها قراءة تنسيق Docx في قاعدة بيانات (على سبيل المثال http://www.brothersoft.com/code-library-for-.net-(sql-server-msde)-22050.html)

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top