سؤال

منذ شيء ما، وأنا أكتب نص صغير استخدام النص::DeDupe لإزالة النسخ المكررة من مشاركات المدونة قبل أن أضع عيني عليها.

بعد القراءة التجميع النحوي للويب الورقة التي يعتمد عليها التنفيذ، أود أن أتمكن من العثور على المستندات المتداخلة (على سبيل المثال.مقتطفات من المدونات بدلاً من النص الكامل، وربما اقتباسات أيضًا).

هل تعرف أي تطبيق آخر في C أو C++ أو Perl يمكنني تجربته قبل كتابة تطبيقي الخاص؟

هل كانت مفيدة؟

المحلول

يبدو أن SpotSigs يناسب فاتورتي تمامًا، إليك بعض المراجع:

تتم استضافة كود المصدر لهذه الوحدة على GitHub:

http://github.com/jzawodn/perl-text-spotsig

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top