سؤال

أنا أفكر في الحل الأمثل مفتوح المصدر لتخزين مستندات XML مع مزيد من الاستعلام عنها بشكل فعال.كمية البيانات ستكون صغيرة.بقدر ما أفهم، قد تشكل قواعد بيانات XML الأصلية حلاً مناسبًا لحالتي.من الواضح أنهم يقومون بتخزين مستندات XML بطريقة فعالة للغاية.سيكون أمرا رائعا أن تتعلم تجربتك.أي اقتراحات بشأن الحل المناسب؟هل لديك أي خبرة في استخدام محركات تخزين XML في تطبيقاتك؟

هل كانت مفيدة؟

المحلول

لقد عملنا مع خوادم XML الأصلية في عملنا.لا بأس إذا كانت بياناتك أقل من 100 إلى 200 ميجا بايت تقريبًا، ولكن بعد ذلك لم أتمكن من العثور على خادم مناسب يمكنه التعامل مع البيانات.لقد حاولت ما يلي:

  • يخرج:خادم XML الأصلي المستند إلى Java (مفتوح المصدر):مع الملفات الكبيرة، عادةً ما تستهلك ذاكرة JVM ثم تقوم بطرح استثناء نفاد الذاكرة
  • سيدنا:خادم XML الأصلي القائم على لغة C (مفتوح المصدر):يمكن التعامل مع قواعد البيانات الكبيرة جدًا، ولكن قد تتعرض للخطأ إذا حاولت الاستعلام عن بيانات غير مفهرسة من قاعدة البيانات
  • قاعدة بيانات Tamino XML (خاصة):واحدة من أولى قواعد بيانات XML، ناضجة ولكنها تتمتع بدعم رديء لـ xquery (على الأقل الإصدار الأحدث الذي نستخدمه يدعم بشكل سيء جدًا XQuery)، وكما رأينا حتى المحترف المدرب لا يمكنه إعداده بشكل صحيح تكون سريعة بما فيه الكفاية.

هذه إقتراحاتي:

  • بالنسبة للبيانات الصغيرة والأنظمة المستندة إلى Java، جرب eXist.حتى أنه يحتوي على دعم قاعدة بيانات يستند إلى ملف يشبه SQlite والذي قد يكون مفيدًا.
  • بالنسبة للبيانات الصغيرة إلى المتوسطة، حيث يكون الأداء مهمًا، استخدم sedna.وفقًا للاختبار الذي أجريته، فهو الأسرع من بين الثلاثة.
  • إذا كنت بحاجة إلى الدعم، فاستخدم Tamino.لديها على الأقل الدعم.

بالنسبة لقواعد البيانات الكبيرة (1 جيجابايت وما فوق)، لا أوصي بأي منها (حتى الآن).عادةً ما يتعطل eXist مع قاعدة بيانات بحجم 200 ميجابايت.تعطلت sedna مع قاعدة بيانات بحجم 1 جيجابايت عند الاستعلام عن شيء غير مفهرس، ولم يتمكن tamino حتى من تحميل 500 ميجابايت من البيانات في تشغيل واحد قبل تعطل النظام بأكمله.بالطبع كل هذه الأنظمة تتطور، لذلك ربما تصبح آمنة للاستخدام بعد قليل، ولكن قواعد بيانات XML الأصلية لا تزال للأسف غير ناضجة.

نصائح أخرى

هل بحثت في الحلول الرئيسية بائع الموردة مثل أوراكل XML DB . أنا لم أحاول ذلك ولكن سيكون بالتأكيد يستحق تقييم توفير لديك ميزانية لمثل هذه الأمور!

وأيضا ويكيبيديا ديك قائمة لطيفة من XML دي بي اس ، والتي قد ترغب في تقييم.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top