Pergunta

Estamos tentando implementar um algoritmo semântico de pesquisa para dar categorias sugeridas com base nos termos de pesquisa de um usuário.

No momento em que implementamos o algoritmo probabilístico ingênuo Bayes para retornar as probabilidades de cada categoria em nossos dados e depois retornar o mais alto.

No entanto, devido à sua ingenuidade, às vezes recebe os resultados errados.

Sem entrar em redes neurais e outras coisas ridiculamente complexas há outra alternativa que podemos investigar?

Foi útil?

Solução

Bayes ingênuos (NB) não é muito diferente do que a regressão logística.Da experiência, a regressão logística supera NB em termos de desempenho preditivo na maioria das vezes.

Além disso, se você tiver dados suficientes e não tiver dados ausentes, provavelmente descobrirá que o desempenho preditivo da NB é praticamente o mesmo que as metodologias mais complicadas, como as redes Bayesianas (BNS), queNão tem a suposição de independência 'ingênua' entre covariáveis.

Se você quiser relaxar a suposição da independência sem ter que mergulhar plenamente no reino do BNS, você pode experimentar o Árvore Aumentada Bayes ingênuos Algoritmo primeiro.

Outras dicas

Se você não considera o SVM linear para ser coisas ridiculamente complexas , você poderia tentar isso.É conhecido por funcionar muito bem para tais tarefas.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top