Domanda

C'è un modo per classificare una particolare frase / paragrafo come divertente. Ci sono alcune indicazioni su dove si dovrebbe andare oltre su questo.

È stato utile?

Soluzione

C'è una ricerca su questo, si chiama computazionale Humor . Si tratta di un settore interdisciplinare che prende elementi dalla linguistica computazionale, psicolinguistica, intelligenza artificiale, machine learning ecc stanno cercando di scoprire che cosa è che rende le storie o scherzi divertenti (ad esempio, il collegamento inaspettato, o utilizzando un argomento tabù in modo sorprendente ecc) e applicarlo al testo (sia per generare una storia divertente o per misurare la 'comicità' di testo).

Ci sono e articoli su di esso (ad esempio con Graeme Ritchie ).

Altri suggerimenti

Si, è necessario utilizzare un Corpora di formazione per costruire un modello predittivo in grado di rilevare le frasi divertenti. A volte questo è noto come "Sentiment Analysis" nella letteratura. Date un'occhiata a questo articolo su Sentiment Analysis con LingPipe .

Se è possibile utilizzare Java, è possibile utilizzare la loro biblioteca (vedi matrice licenza ). Ho trovato molto utile, non esattamente nello stesso contesto di te.

L'unico modo per tirare fuori questo è quello di ottenere un paio di migliaia di persone (le scimmie non lo farà, sorry) di guardare attraverso migliaia di frasi divertenti / storie, li vota, e poi costruire una sorta di sistema esperto / neurale rete fuori di esso. Data la portata del problema e la soggettività di essa (una cosa divertente per una persona potrebbe non essere divertente - anche offensivo - ad un altro), direi che si tratta di un compito impossibile

.

È possibile utilizzare la stessa tecnica di filtri anti-spam. Invece di spam / non spam si classifica sul divertente / non-divertente. Se vuoi in classificatori Bayesiani naive per ulteriori informazioni.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

Inoltre, prova a computazionale Humor @ Google Scholar se siete serio di rimettersi in campo. Sentiment Analysis è stato menzionato anche, vedi wikipedia su questo.

Naturalmente, tutto questo dipende da ciò che il vostro campo di applicazione e gli obiettivi sono ...

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top