ما هي الآثار المترتبة على "XML إيابا" على مستندات Word 2003؟

StackOverflow https://stackoverflow.com/questions/1077867

  •  21-08-2019
  •  | 
  •  

سؤال

وحفظ مستند Word 2003 إلى XML ومن ثم العودة النتائج في انخفاض حجم الملف، وربما أكثر أنني لا أعرف عنه. A فرق على WordML وثيقة جديدة ضد القديمة يظهر الاختلافات فقط في مراجعة حفظ البائع. لذلك، ما هو التخبط في ذهاب وإياب ؟

إذا هو في الواقع التخبط شيئا، ثم كيف يمكن للمرء أن يفسر بضعة آلاف بايت من حجم الملف؟

هل كانت مفيدة؟

المحلول

وبقدر ما أعرف يخزن Word بعض المعلومات بالإضافة إلى نص والتنسيق في ملفات DOC، للحصول على معلومات سبيل المثال المستخدم، بعض الاشياء عن تاريخ وثيقة، الخ تتراكم هذه المعلومات عند استخدام "ملف> حفظ". أفترض أن حفظ ك XML وإعادة موفرة للشرائط DOC تلك المعلومات.

إذا لم تخني، بسيطة "حفظ باسم" يقلل حجم الملف بالفعل وأعتقد أن هناك تستخدم ليكون بعض عناصر القائمة التي تسمح لك لحفظ نسخة من ملف DOC التي كانت أصغر بكثير في الحجم من "ملف> حفظ نسخة ".

نصائح أخرى

وفيما يلي مجرد تخمين.

وملف .doc هو في الواقع OLE التخزين المركبة الملف المركب . وهذا الأخير هو وسيلة لحزمة تيارات متعددة في وثيقة واحدة بطريقة واضحة المعالم، والهيكل هو في الواقع قريبة جدا من نظام الملفات في واحد في ملف - على سبيل المثال، لديها "القطاعات"، وجدول تخصيص القطاع . هذا النهج يجعل من الممكن لتحرير ملف المستند في نفس المكان دون إعادة كتابة تماما.

ولكن، ونتائج هذا النهج التخزين في بعض التكرار، مثل القطاعات غير المستخدمة. عند ذهاب وإياب الملف، يمكنك إعادة بشكل فعال من الصفر، وبالتالي يتم التخلص من أي من هذه القطع الأثرية تخزين زائدة عن الحاجة.

إذا نظرتم الى مستند Word (.doc) في محرر عرافة، وسترون ان هناك الكثير والكثير من الكتل أصفار زائدة عن الحاجة. شكل كبير، وثيقة!

وعلى أي حال، وتوفير لXML ومن ثم العودة إلى وثيقة قد تخلص من بعض من تلك الآلاف من وحدات البايت أصفار.

إذا كنت غريبة حقا مجرد فتح كل الملفات في محرر عرافة وإدارة فرق الخوارزمية، يمكنك محاولة رشة عمل الهيكس والهيكس محرر الجدد.

وتجاربي مع عدد قليل من كلمة كبيرة وثائق 2003 تبين أن حفظ ك XML، ثم حفظ أنه ثيقة، يؤدي في الواقع في بعض الشيء، ولكن ليس بشكل كبير، ملف أصغر. كما كنت أشير، سمات rsidR مختلفة، ولكن هذا لا يفسر الانخفاض في حجم منذ rsidRs الجديدة عادة ما تكون بنفس الحجم.

وكما يشير Danra بها، ملفات .doc لها يمتد من وحدات البايت متطابقة. لكن ملف أصغر حفظها بتنسيق doc ديه أيضا هذه أشواط، لذلك أعتقد أن هذا هو قطعة أثرية من تنسيق ثنائي doc و ليس البيانات التي تحمل المعلومات. I eyeballed عدد قليل من ملفات .doc ذهابا وتعثرت ويمكن أن نرى أي اختلاف في المظهر على الإطلاق، ودعم فكرة أن الخلافات ليست المعلومات الدفترية.

وفحص ملفات XML التي تم إنشاؤها بعد المستديرة التعثر يظهر الفرق الرئيسي هو عدة امتاز (خصائص تشغيل) مع أي محتوى يتم إزالتها بعد التحول إلى XML. على ما يبدو حفظ ك XML يزيل أنماط الحرف غير المستخدمة والممتلكات.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top