Question

Je dois analyser le poste d'un utilisateur et les classer. Par exemple: Je dois classer chaque poste en tant que « acheter » poste ou un poste « vendre » basé sur le texte - « Je suis à la recherche vendre ma maison » est classé comme « vendre ». Le problème est que, souvent, ce ne est pas si simple - « Je suis à la recherche de se débarrasser de ma vieille maison » doit également être classé comme « vendre ». « Je suis à la recherche d'une maison » devient « acheter ». Je voudrais également classer ces postes en fonction de l'élément en question -. Par exemple, le poste ci-dessus serait classé comme « acheter » et comme « maison »

Quelqu'un peut-il recommander une bonne approche / bon cadre / technique en matière d'analyse et de compréhension entrée utilisateur? Merci.

Était-ce utile?

La solution

Vous avez raison; il est une chose difficile à faire.

Yahoo! a une Terme Extraction API / service Web que vous pouvez utiliser. C'est une très bonne façon d'utiliser l'analyse linguistique sur votre propre texte sans écrire un million de lignes de code pour le faire vous-même. Je ne l'ai pas utilisé, donc je n'ai aucune idée comment il fonctionne avec des significations similaires, votre question demande.

Autres conseils

Qu'est-ce que vous parlez est essentiellement un problème de filtrage bayésien , également utilisé pour le spam filtration. Voir aussi ce discours . Il est une zone assez compliquée.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top