melhor abordagem para analisar texto em PHP?
-
21-08-2019 - |
Pergunta
Eu preciso analisar pós um dos usuários e categorizá-lo. Por exemplo: eu tenho que classificar cada post como um posto de "comprar" ou um posto de "vender" com base no texto - "Eu estou olhando para venda minha casa" é classificado como "vender". O problema é que muitas vezes não é tão simples - "Eu estou olhando para se livrar de minha antiga casa" também precisa ser classificado como "vender". "Eu estou procurando uma casa" torna-se "comprar". Eu também gostaria de categorizar estes lugares com base no item em questão -. Por exemplo, o cargo seria categorizado como "buy" e como "casa" acima
Alguém pode recomendar uma abordagem bom / boa estrutura / técnica quando se trata de analisar e entrada do usuário entendimento? Obrigado.
Solução
Você tem razão; é uma coisa difícil de fazer.
Yahoo! tem um Term Extração API / serviço Web que você pode usar. É uma boa maneira bonita de usar a análise de linguagem em seu próprio texto sem escrever um milhão de linhas de código para fazê-lo sozinho. Eu nunca usei isso, então eu não tenho idéia de como ele funciona bem com significados semelhantes, como a sua pergunta pede.
Outras dicas
O que você está falando é basicamente um Bayesian filtragem problema , também usado por spam filtrando. Veja também essa conversa . É uma área razoavelmente complicado.