سؤال

ما هي الطريقة الموثوقة لحساب الأحرف و/أو الكلمات تلقائيًا في ملف .doc أو .docx؟

الشرط الحقيقي الوحيد هو عدد دقيق وموثوق بشكل معقول.
يحتاج إلى العمل مع المستندات التي تحتوي على شيء آخر غير البرنامج النصي اللاتيني ، لذلك يعد حساب الشخصيات جيدًا بما يكفي لمعظم الحالات.
لا يحتاج العد بالضرورة إلى مطابقة Word ، ولكن كلما كان ذلك أفضل.
نظرًا لوجود تطبيقات مختلفة من Gazillion يمكنها إنشاء ملفات .DOC ، لا بأس في فشل حساب أي شيء ، ولكن يجب أن تكون هذه الحالة قابلة للقبض ، لذلك ندرك أن العد قد يكون غير دقيق. لجميع الحالات الأخرى ، يجب أن يكون العدد ، على سبيل المثال ، دقيقًا على الأقل 99 ٪ على الأقل 99 ٪ من الوقت.

أنا منفتح على التقنيات المعنية ، لكن شيء يمكن تشغيله على سطر أوامر *NIX يفضله إلى حد كبير.

هل هناك حل معقول لهذا؟

هل كانت مفيدة؟

المحلول

ها هو حلقة الوصل إلى بعض محولات Linux Word-to-text.

على سبيل المثال يمكنك استخدامه

antiword file.doc | wc

للقيام بالعد.

تعديل:

هذه حلقة الوصل يوضح أن AbiWord لديها واجهة سطر الأوامر ، يمكنك استخدامها لتحويل تنسيق .docx إلى .txt ثم حساب الكلمات باستخدام "WC". ABIWORD لا يدعم تنسيق DOCX

نصائح أخرى

يتمتع Mac OS X بدعم لقراءة ملفات الكلمات المضمنة في أطر العمل ، لذلك إذا كان لديك ذلك ، فهذا أمر سهل. عينة الماكروبي:

NSSpellChecker.sharedSpellChecker.countWordsInString(NSAttributedString.alloc.initWithURL(fileURL, documentAttributes:nil), language:nil)

بشكل أكبر - على الرغم من أنه يتخلى عن الدعم لـ DOCX - يمكنك ببساطة الحصول على مضادات الكلمات والقيام به antiword | wc -w.

نشرت Microsoft أ تخصيص لتنسيقات الملف الثنائي المكتب. لا يبدو تحليل ملف .DOC تافهة ، ولكن مع بعض العناية ، يجب أن تكون قادرًا على الحصول على نتيجة يمكن الاعتماد عليها. ليس لدي أي فكرة عن مدى توافقها مع ما يظهره الكلمة - ربما يعتمد (على الأقل جزئيًا) على كيفية تعريفك "كلمة" - على سبيل المثال ، سواء كنت تفكر في مجموعة من الأرقام "كلمة" أو لا . ربما لن يستغرق الأمر الكثير لمعرفة كيفية تعامل Word مع حالات كهذه ، لذلك لا ينبغي أن يكون الحصول على مباراة قريبة أمرًا صعبًا للغاية.

إذا كنت تفكر في التطبيقات عبر الإنترنت كحل ، نعم ، هناك حل.
هذا الموقع ليس جميلًا (فيما يتعلق بالتصميم) يوفر عدد الكلمة والشخصيات: http://allworldphone.com/count-words-characters.htm

لا أعتقد أن هناك حدًا ، ولا ينبغي أن يكون مشكلة فقط نسخ/لصق محتويات مستنداتك في النص المقابل ورؤية النتيجة.

فيما يتعلق بدقة 100 ٪ أو 99 ٪ ، يمكنك اختبارها مع عدد قليل (أي 20-50 كلمة) من خلال حسابها بنفسك أولاً.

آمل أن يساعد هذا. يعتبر. كريس

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top