Pergunta

Eu estou armazenando documentos em SQL Server 2005 e estou procurando uma maneira de colar no texto de um documento e, em seguida, procurar potencial plágio (conteúdo copiado) no banco de dados.

Qual é a melhor maneira de ir sobre isso? Existe uma maneira de obter um indicador para a extensão em que algo é semelhante a outra coisa usando indexação de texto completo, por vários parágrafos de conteúdo?

Foi útil?

Solução

Por que você não instalar o Google Desktop e tê-lo único índice que um diretório

então você pode ter o Google faça a indexação para você

Outras dicas

Isto não é realmente o tipo de problema que a indexação de texto completo no SQL Server é projetado para resolver. Não há nada construído para SQL Server que você pode realmente usar para ajudar com isso.

Há uma série de ferramentas de detecção de plágio especializada, que uma pesquisa no Google irá transformar-se para você. Isso é provavelmente a sua melhor aposta.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top