سؤال

ما هي أفضل طريقة لفهرسة وثائق PDF؟ هل يجب علي فهرسها عن طريق تحويل مستندات PDF إلى TXT أو هناك طريقة أفضل لفهرسة ملفات PDF؟

هل كانت مفيدة؟

المحلول

على افتراض أنك تتحدث عن SOLR: انظر ExtractingRequestHandler.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top