سؤال

لدينا تطبيق ويب يتيح للمستخدمين تحميل المستندات وإنشاء مستنداتهم الخاصة وما إلى ذلك.يتم تخزين الملفات التي تم تحميلها على Amazon S3، ويتم تخزين المعلومات التي تم إنشاؤها في قاعدة بيانات MySQL.ما أبحث عنه هو نوع ما من محركات البحث، حيث أقوم بتزويده بجميع مستنداتنا النصية، كل منها بمعرف فريد، ويقوم بإنشاء فهرس أو أي شيء آخر.لاحقًا، يمكنني أن أعطيها استعلامات بحث، وسوف تسحب أفضل المستندات المطابقة (من خلال معرفها)، بالإضافة إلى مقتطفات من النص المطابق.

في الأساس، نريد السماح لمستخدمينا بالبحث في مستودع المواد التي تم تحميلها، إلى جانب أي شيء قام المستخدمون الآخرون بوضع علامة عليه على أنه عام.يجب أن يعمل الحل على خادم Linux قياسي، ومن الأفضل أن يكون مفتوح المصدر، لكنني سأفكر أيضًا في الحلول المدفوعة إذا لم تكن أسعارها باهظة.

لقد وجدت حتى الآن ثلاثة مرشحين محتملين:

  1. MySQL البحث عن النص الكامل - بعض التقارير التي قرأتها تشير إلى أنها بطيئة جدًا
  2. أباتشي لوسين - للأسف مكتوب بلغة جافا، ولكنني سأستخدمه إذا اضطررت لذلك.يفترض بسرعة
  3. أبو الهول - لا يبدو أنه يحظى بشعبية كبيرة، ومن الأفضل أن يحظى أي حل أجده بالكثير من الدعم المجتمعي.

يرجى إعلامي إذا كانت هناك أي خيارات جيدة أخرى أغفلتها، أو إذا كانت لديك خبرة في أي مما سبق.

هل كانت مفيدة؟

المحلول

نلقي نظرة على سولر.إنها مبنية على Lucene، لذا فهي سريعة جدًا، وسهلة الاستخدام من أي منصة.

نصائح أخرى

أبو الهول قد يكون الأمر يستحق اهتمامك، لأنه يعمل بشكل جيد مع العديد من أنظمة RDMS الشائعة (خاصة MySQL)

يوجد ايضا اكسابيان وهو سريع وقابل للتخصيص تمامًا.

إنه يدعم المفهرسات المخصصة التي تسمح بفهرسة البيانات غير المخزنة في قاعدة بيانات والتي قد تكون مفيدة لمستنداتك المخزنة على S3.

اتخيل ان جوجل سيكون لديك حل يلبي احتياجاتك.أبدأ هنا: جوجل إنتربرايز

يوجد ميناء روبي في لوسين يسمى "النمس".بالإضافة إلى Ruby API، يمكنك الحصول على تطبيق C الأساسي المسمى "cFerret".

لوسين جيد جدا.وعلى الرغم من أنه تمت كتابته في الأصل بلغة جافا، إلا أنه يوجد تطبيق PHP http://framework.zend.com/manual/en/zend.search.lucene.html

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top