كيفية قراءة ISBN من الكتب الإلكترونية على CHM أو PDF الملفات

StackOverflow https://stackoverflow.com/questions/406484

  •  03-07-2019
  •  | 
  •  

سؤال

وأنا بعمل قاعدة بيانات لتخزين بلدي جمع الكتاب الاليكتروني.
معظمهم لديهم ISBN داخل النص من الكتاب نفسه.
كيف يمكنني الوصول إلى هذه المحتويات منتديات هل هناك أي المصدرية أو دلس للقيام بذلك؟

هل كانت مفيدة؟

المحلول

وأنا فعلت هذا لالاليكترونى التطبيق مكتبة. أولا وقبل كل شيء تحتاج إلى استخراج النص من آلية تبادل المعلومات أو ملف قوات الدفاع الشعبي. هناك الكثير من المرافق \ المكتبات للقيام بذلك. هنا هو المقالة على CodeProject حول كيفية استخراج المحتوى من ملفات CHM. لملفات PDF اعتدت pdftotext فائدة. عندما تحصل نص عادي من الكتاب الاليكتروني تحليل باستخدام التعبير العادية لتجد ISBN10 / 13 الرمز.

نصائح أخرى

واستخراج النص من CHM و <لأ href = "HTTP: //www.codeproject.com/KB/cs/PDFToText.aspx "يختلط =" نوفولو noreferrer "> PDF الملفات هي الخطوة الأولى. التالي يمكنك العثور على رقم ISBN مع التعبير العادية .

scroll top