سؤال

أنا أبحث عن المصدر المفتوح البحث فهرسة المكتبة.أنها ستستخدم جزءا لا يتجزأ من تطبيق ويب لذلك يجب أن يكون رمز صغير الحجم.ويفضل أن تكون مكتوبة بلغة C, C++ أو PHP و لا يتطلب أي قاعدة بيانات ليتم تثبيتها لتخزين الفهارس.فهارس يجب أن يتم تخزينها في ملف بدلا من ذلك (على سبيل المثال, xml, txt).حاولت البحث عن بعض البحث الشهير المكتبات مثل xapian و clucene, أنهم جيد ولكن يكون كبير نسبيا رمز حجم جزءا لا يتجزأ من النظام.

هذا وسيتم تشغيلها على منصة لينكس وسيتم استخدام مؤشر ملفات HTML.

أي الأفكار حول ما يمكن أن يكون بحث جيد المكتبة/API للاستخدام ؟

شكرا

هل كانت مفيدة؟

المحلول

نصائح أخرى

يا رجل.هناك عدد قليل.في ترتيب تنازلي الغموض...

أنا متأكد من أن هناك أكثر من نصف طن من هناك, ولكن هؤلاء هم عندي من أعلى رأسي.بالتوفيق :)

الأولى:لديك لتخزين الفهارس في مكان ما.لذا ملف البيانات سوف تكون هناك حاجة إلا إذا كنت تريد الذاكرة فقط الفهارس.

إلى مؤشر عام البنود, يمكنني أن أوصي لكم sqlite: http://www.sqlite.org/.حتى أنا استخدامه في الذاكرة فقط عندما يكون لدي مجموعة من البيانات و أنا بحاجة إلى التعامل مع فهارس متعددة.

ذلك يعتمد على الاحتياجات الخاصة بك.كامل توزيع لوسين (جافا) حتى 3MB ملف JAR, ولكن في الممارسة العملية يمكن تجريد تحت 1MB.CLucene هو على الأرجح أقل بكثير في الممارسة.كيف منخفضة لا تحتاج إلى الذهاب ؟ ...

حفيف-E هو مكتوب في C و قد تفعل ما تريد.لا تتطلب قاعدة البيانات يستخدم ثنائي مؤشر تنسيق الملف.

لقد استخدمت أيضا ht://حفر ولكن يبدو أنه مر وقت طويل منذ أن البرنامج تم الحفاظ عليها.

كلا سوف تجمع على لينكس و مؤشر HTML على ما يرام.

الخيار الثالث هو الصينية المستخدمة من قبل AustLII.الاتصال بفريق هناك تأكد من الحصول على أحدث إصدار.وينبغي أن تجمع على لينكس دون الكثير من المتاعب.انها ليست حقا تصميم النظم المضمنة (الصينية لتقف على حجم أي كائن) ولكن قد لائق API على ذلك الماضي بحثت و صغيرة نسبيا (حتى, انها ليست مصممة لذلك ولكن قد تعمل فقط كذلك).تستهدف HTML.سريع جدا في الفهرسة.تستحق نظرة على ما أعتقد.(الكشف:عملت هناك منذ وقت طويل)

وأخيرا ، فإننا نستخدم المؤسسة العامة لاستصلاح الأراضي والتي تقوم على لوسين.المؤسسة العامة لاستصلاح الأراضي يستخدم API بسيطة على أساس نشر مستندات XML إلى ملقم.بسيطة جدا على التفاعل مع بغض النظر عن اللغة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top