Pergunta

Existe uma maneira de classificar uma determinada frase / parágrafo tão engraçado. Há muito poucas indicações quanto ao local onde se deve ir mais longe sobre este assunto.

Foi útil?

Solução

Há pesquisas sobre isso, ele é chamado Computacional Humor . É uma área interdisciplinar que toma elementos de linguística computacional, psicolingüística, inteligência artificial, aprendizado de máquina etc. Eles estão tentando descobrir o que é que as histórias fizer ou piadas engraçadas (por exemplo, a conexão inesperada, ou usando um tema tabu de forma surpreendente etc) e aplicá-lo ao texto (ou para gerar uma história engraçada ou para medir a 'funniness' do texto).

e artigos sobre o assunto (por exemplo, Graeme Ritchie ).

Outras dicas

Sim, você deve usar um Corpora Formação para construir um modelo preditivo capaz de detectar frases engraçadas. Às vezes isso é conhecido como "Análise de sentimento" na literatura. Dê uma olhada neste artigo sobre Sentiment Analysis com LingPipe .

Se você pode usar Java, você pode usar sua biblioteca (ver licença matriz ). Eu achei muito útil, não exatamente no mesmo contexto do que você.

A única maneira de conseguir isso é obter um par de milhares de pessoas (macacos não vai fazer, sorry) para procurar através de milhares de engraçado frases / histórias, avaliá-los e, em seguida, construir algum tipo de sistema especialista / neural a rede de fora. Dada a amplitude problema ea subjetividade dela (uma coisa engraçada para uma pessoa pode não ser engraçado - mesmo ofensiva - a outra)., Eu diria que é uma tarefa impossível

Você pode usar a mesma técnica que os filtros de spam. Em vez de spam / não-spam que você classificar com engraçado / não-engraçado. Olhe para classificadores bayesiana ingênuos para mais informações.

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

Além disso, tente Computacional Humor @ Google Scholar Se você é sério em entrar no campo. Sentiment Analysis foi mencionado também, veja wikipedia sobre isso.

Claro, isso tudo depende do que o seu âmbito e objectivos são ...

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top