سؤال

أحاول إضافة إمكانيات بحث نصية كاملة إلى تطبيق ROR الخاص بي، لكن مواجهة بعض المشكلات عندما يتعلق الأمر باللغة العربية. AFAIK، لا يوجد العديد من محركات البحث هناك التي تدعم اللغة العربية الناشئة والمورفولوجيا وغيرها من البحث النص الكامل المتقدمة. الشيء الوحيد الذي وجدته كان Lucene مع Thamenizer Aramorph.

يبدو أن البرنامج المساعد ACTS_AS_SOLR (SLORR يعتمد على لوسين، وهذا البرنامج المساعد يدمجه مع القضبان) مهجورة، ولا يمكنني العثور على أي وثائق مفيدة.

لقد نظرت إلى أبو الهينكس، Xapian، النمس، و Acts_as_Searchable، لكن لا أحد منهم يقدم وظائف بحث عربية متقدمة بأفضل ما في حد علمي.

أي مساعدة سيكون موضع تقدير حقا

== التحديث
لدي اقتراحات لاستخدام أبو الهول، واستخدمتها في مشروع سابق، ويعمل على ما يرام. ومع ذلك، فإنه لا يوفر أي قدرات بحث متقدم.
على سبيل المثال، الكلمات: كتاب (كتاب)، مكتبة (مكتبة)، وكاتب (كاتب) مشتقة من نفس جذع الكتب. أريد أن أحصل على القدرة على البحث عن "الكاتب" والحصول على نتائج لجميع الكلمات المستمدة من نفس الجذع.
أيضا، أريد أن يأخذ البحث في الاعتبار أساليب الإملاء العربي المشتركة. يستخدم البعض "حمزة" (همسة) وبعض الناس لا. يكتب آخرون الكلمات بالحرف "Taa Marboota" (التواء المربوتة) بينما يستخدم الآخرون الحرف "HAA" (الهاء). يجب أن يدرك محرك بحث عربي جيد مثل هذه الاختلافات الدقيقة وتبحث عنها.

مع SPHINX، تحصل فقط على ما تبحث عنه، والمحرك الوحيد الذي وجدته لاستيعاب مثل هذه الأمور في اللغة العربية، كان لوسن مع Tokenizer Aramorph. ومع ذلك، يتم التخلي عن Acts_as_solr (البرنامج المساعد Lucene للقضبان). لذا فإن سؤالي هو: هل هناك أي مزامنة أخرى لأي محرك بحث؟
Nandadaboggu المذكورة Sunspot، سأقدم هذا الذهاب، والرد

هل كانت مفيدة؟

المحلول

يجب أن تحاول ذلك عن طريق توسيع خيارات التفكير SPHINX

اقرا هذا: http://www.expressionlab.com/2008/11/19/Thinking-sphinx-in-arabic-unicode.

نصائح أخرى

لاستخدام سولر Sunspot. و قضبان السعة.

لاستخدام أبو الهول التفكير أبو الهول

كلا الأحجار الكريمة ممتازة ولها قاعدة تثبيت كبيرة. لقد استخدمت Thinkingsphinx في عدد قليل من المشاريع وأوصي بشدة بذلك.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top