Pregunta

¿Hay una manera de clasificar una frase / párrafo en particular como divertida. Hay muy pocos punteros en cuanto a dónde se debe ir más allá de esto.

¿Fue útil?

Solución

Hay una investigación en este, se llama Computacional Humor . Es un área interdisciplinaria que toma elementos de la lingüística computacional, la psicolingüística, la inteligencia artificial, aprendizaje automático, etc. Ellos están tratando de averiguar qué es lo que hace historias o chistes (por ejemplo, la conexión inesperada, o el uso de un tema tabú de una manera sorprendente etc) y aplicarlo en el texto (ya sea para generar una historia divertida o para medir la 'comicidad' del texto).

y artículos al respecto (por ejemplo, mediante Graeme Ritchie ).

Otros consejos

Sí, se debe utilizar un corpus de entrenamiento para construir un modelo predictivo capaz de detectar frases divertidas. A veces esto se conoce como "Sentiment Analysis" en la literatura. Echar un vistazo a este artículo sobre Sentiment Analysis con LingPipe .

Si puede utilizar Java, puede utilizar su biblioteca (consulte ). Me pareció muy útil, no exactamente en el mismo contexto que tú.

La única manera de conseguir esto es conseguir un par de miles de personas (monos no lo harán, lo siento) para mirar a través de miles de oraciones / divertidas historias, la tasa de ellos, y luego construir algún tipo de sistema experto / neuronal la red fuera de él. Dado el alcance de problemas y la subjetividad de la misma (una cosa divertida para una persona puede no ser gracioso - incluso ofensivos - a otro), diría que es una tarea imposible

.

Puede utilizar la misma técnica que los filtros de spam. En lugar de spam / no spam a clasificar en la divertida / no-divertido. Mira en clasificadores bayesianos ingenuos para más información.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

Además, trate Computacional Humor @ Google Académico si usted es serio en entrar en el campo. Análisis sentimiento ha sido mencionado también, ver Wikipedia en eso.

Por supuesto, todo esto depende de lo que su alcance y objetivos son ...

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top