سؤال

لديّ تطبيق حيث أسمح للمستخدمين بتحميل الملفات ، وخاصة مستندات PDF و Word. يتم تخزين هذه الملفات في حقل varbinary في قاعدة البيانات. لما يستحق الأمر ، أحتاج إلى توفر هذه الملفات بغض النظر عن كيفية الوصول إلى المستخدم ، عبر تطبيق Web أو Windows Forms أو أي طبقة عرض تقديمية أخرى.

هل هناك طريقة للبحث في محتويات النص الخام لهذه الحقول؟ على سبيل المثال ، إذا قمت بتحميل السيرة الذاتية ، أود أن يكون المستخدم قادرًا على البحث عن C# وتكون قادرًا على البحث في محتويات حقل Varbinary للنص المحدد.

أيضًا ، إذا كانت هناك استراتيجية أفضل للتعامل مع هذا ، فأنا منفتح عليه.

هل كانت مفيدة؟

المحلول

أود أن أقول إن استخدام SQL Server هو الأداة الخاطئة للمهمة (Search-Wise) لأنه لا يمكن تحليله أصلاً من خلال النص المخزن في مستند ثنائي.

أقترح النظر في شيء مثل Lucene.net (منفذ .NET لمحرك بحث Lucene ... مكتوب أصلاً في Java) والذي سيسمح لك بالبحث بسهولة من خلال مستنداتك بعد تحميلها.

يجب أن تكون قادرًا على هندسة حل يتيح لك الاحتفاظ بتخزين المستند الخاص بك في SQL Server ولكن استخدام lucene.net لفهرسة والبحث في المستندات التي قمت بتخزينها هناك.

نصائح أخرى

تحتاج إلى طبقة من بعض التعليمات البرمجية لاستخراج النوع والمعرفة بالتنسيق. إلى SQL ، إنها مجرد بيانات خام

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top