Поиск полнотекстовых полей в SQL Server для обнаружения плагиата

StackOverflow https://stackoverflow.com/questions/686874

Вопрос

Я храню статьи в SQL Server 2005 и ищу способ вставить текст статьи, а затем искать потенциальный плагиат (скопированный контент) в базе данных.

Как лучше всего это сделать?Есть ли способ получить оценку степени сходства чего-либо с чем-то другим с помощью полнотекстового индексирования для нескольких абзацев контента?

Это было полезно?

Решение

почему бы вам не установить Google Desktop и не индексировать только один каталог

тогда вы можете поручить Google выполнить индексацию за вас

Другие советы

На самом деле это не та проблема, для решения которой предназначена полнотекстовая индексация в SQL Server.В SQL Server нет ничего встроенного, что можно было бы действительно использовать в этом вопросе.

Существует ряд специализированных инструментов обнаружения плагиата, которые вам выдаст поиск Google.Это, вероятно, ваш лучший выбор.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top