Pergunta

Eu preciso analisar pós um dos usuários e categorizá-lo. Por exemplo: eu tenho que classificar cada post como um posto de "comprar" ou um posto de "vender" com base no texto - "Eu estou olhando para venda minha casa" é classificado como "vender". O problema é que muitas vezes não é tão simples - "Eu estou olhando para se livrar de minha antiga casa" também precisa ser classificado como "vender". "Eu estou procurando uma casa" torna-se "comprar". Eu também gostaria de categorizar estes lugares com base no item em questão -. Por exemplo, o cargo seria categorizado como "buy" e como "casa" acima

Alguém pode recomendar uma abordagem bom / boa estrutura / técnica quando se trata de analisar e entrada do usuário entendimento? Obrigado.

Foi útil?

Solução

Você tem razão; é uma coisa difícil de fazer.

Yahoo! tem um Term Extração API / serviço Web que você pode usar. É uma boa maneira bonita de usar a análise de linguagem em seu próprio texto sem escrever um milhão de linhas de código para fazê-lo sozinho. Eu nunca usei isso, então eu não tenho idéia de como ele funciona bem com significados semelhantes, como a sua pergunta pede.

Outras dicas

O que você está falando é basicamente um Bayesian filtragem problema , também usado por spam filtrando. Veja também essa conversa . É uma área razoavelmente complicado.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top