Pesquisando campos de texto completo no SQL Server para detectar plágio
-
22-08-2019 - |
Pergunta
Eu estou armazenando documentos em SQL Server 2005 e estou procurando uma maneira de colar no texto de um documento e, em seguida, procurar potencial plágio (conteúdo copiado) no banco de dados.
Qual é a melhor maneira de ir sobre isso? Existe uma maneira de obter um indicador para a extensão em que algo é semelhante a outra coisa usando indexação de texto completo, por vários parágrafos de conteúdo?
Solução
Por que você não instalar o Google Desktop e tê-lo único índice que um diretório
então você pode ter o Google faça a indexação para você
Outras dicas
Isto não é realmente o tipo de problema que a indexação de texto completo no SQL Server é projetado para resolver. Não há nada construído para SQL Server que você pode realmente usar para ajudar com isso.
Há uma série de ferramentas de detecção de plágio especializada, que uma pesquisa no Google irá transformar-se para você. Isso é provavelmente a sua melhor aposta.