هل هناك مجموعة من أفضل الممارسات لبناء فهرس Lucene من قاعدة بيانات علائقية؟
المحلول
ونحن طرح أول تطبيق لدينا يستخدم المؤسسة العامة الليلة. مع المؤسسة العامة 1.3، لقد تضمنت DataImportHandler التي تسمح لك لتحديد جداول قاعدة البيانات الخاصة بك (يسمونهم الكيانات) جنبا إلى جنب مع علاقاتهم. مرة واحدة محددة، وطلب HTTP بسيط tirgger استيراد البيانات الخاصة بك.
ونلقي نظرة على صفحة ويكي المؤسسة العامة للDataImportHandler للحصول على التفاصيل.
نصائح أخرى
وسيتم كتابة تطبيقات متعددة إلى قاعدة البيانات؟ إذا كان الأمر كذلك، انها صعبة بعض الشيء. أن يكون لديك بعض آلية لتحديد سجلات جديدة لإطعام المفهرس لوسين.
وثمة نقطة أخرى للنظر هو هل تريد مؤشر واحد يغطي جميع الجداول الخاصة بك، أو مؤشر واحد في الجدول. بشكل عام، فإنني أوصي مؤشر واحد، مع حقل في هذا المؤشر للإشارة إلى أي جدول جاء السجل من.
السبات يحظى بدعم لبحث النص الكامل، إذا كنت تريد البحث الأجسام الثابتة بدلا من الوثائق غير منظم.
وهناك مشروع OpenSymphony دعا البوصلة التي يجب أن تكون على علم بها. وقد بقيت بعيدا عن نفسي، في المقام الأول لأنه يبدو أن على الطريق المزيد تعقيدا مما يحتاج البحث ليكون. أيضا، وأستطيع أن أقول من وثائق (وأنا أعترف أني لم أجد الوقت الكافي لقراءة كل شيء)، فإنه يخزن شرائح لوسين كما النقط في قاعدة البيانات. إذا كنت على دراية العمارة لوسين، البوصلة تنفذ دليل لوسين على رأس قاعدة البيانات. وأعتقد أن هذا هو نهج خاطئ. وأود أن الحصول على دعم قاعدة البيانات المدمج في لفهرسة وتنفيذ وسين IndexReader بدلا من ذلك. وينطبق نفس الانتقادات إلى تطبيقات مخبأ توزيعها، وما إلى ذلك.
وأنا لم تستكشف هذا على الإطلاق، ولكن إلقاء نظرة على الموقع LuSql .
وعن طريق المؤسسة العامة سوف تكون واضحة كذلك، ولكن سيكون هناك بعض - الانتهاكات مع schema.xml المؤسسة العامة والخاصة بك مخطط قاعدة البيانات الفعلية. (لمعلوماتك، المؤسسة العامة يفعل البدل الدعم، وإن كان.)
كمقدمة:
كتب بريان ماكاليستر تدوينة لطيفة: استخدام لوسين مع OJB.