Domanda

Ho bisogno di analizzare messaggio di utilizzatori e categorizzare esso. Ad esempio: ho categorizzare ogni post come un post "buy" o un post "vendere" in base al testo - "Sto cercando di vendere la mia casa" è classificato come "vendere". Il problema è che spesso non è così semplice - "Sto cercando di sbarazzarsi della mia vecchia casa" ha anche bisogno di essere classificato come "vendere". "Sto cercando una casa" diventa "buy". Vorrei anche per classificare tali posti sulla base della voce in questione -. Ad esempio, il post di cui sopra sarebbe stato classificato come "buy" e come "casa"

Qualcuno può consigliare un buon approccio / buon quadro / tecnica quando si tratta di analizzare e comprendere l'input dell'utente? Grazie.

È stato utile?

Soluzione

Hai ragione; è una cosa difficile da fare.

Yahoo! ha un Estrazione termini servizio API / Web è possibile utilizzare. E 'un buon modo per utilizzare l'analisi lingua sul proprio testo senza scrivere un milione di righe di codice per farlo da soli. Non ho usato, quindi non ho idea di come funziona con significati simili, come la tua domanda chiede.

Altri suggerimenti

Che cosa si sta parlando è fondamentalmente un Bayesiano problema del filtraggio , utilizzato anche per lo spam filtraggio. Vedi anche questo discorso . Si tratta di una zona abbastanza complicata.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top