PNL frases Classificar / parágrafo tão engraçado
-
23-08-2019 - |
Pergunta
Existe uma maneira de classificar uma determinada frase / parágrafo tão engraçado. Há muito poucas indicações quanto ao local onde se deve ir mais longe sobre este assunto.
Solução
Há pesquisas sobre isso, ele é chamado Computacional Humor . É uma área interdisciplinar que toma elementos de linguística computacional, psicolingüística, inteligência artificial, aprendizado de máquina etc. Eles estão tentando descobrir o que é que as histórias fizer ou piadas engraçadas (por exemplo, a conexão inesperada, ou usando um tema tabu de forma surpreendente etc) e aplicá-lo ao texto (ou para gerar uma história engraçada ou para medir a 'funniness' do texto).
Há e artigos sobre o assunto (por exemplo, Graeme Ritchie ).
Outras dicas
Sim, você deve usar um Corpora Formação para construir um modelo preditivo capaz de detectar frases engraçadas. Às vezes isso é conhecido como "Análise de sentimento" na literatura. Dê uma olhada neste artigo sobre Sentiment Analysis com LingPipe .
Se você pode usar Java, você pode usar sua biblioteca (ver licença matriz ). Eu achei muito útil, não exatamente no mesmo contexto do que você.
A única maneira de conseguir isso é obter um par de milhares de pessoas (macacos não vai fazer, sorry) para procurar através de milhares de engraçado frases / histórias, avaliá-los e, em seguida, construir algum tipo de sistema especialista / neural a rede de fora. Dada a amplitude problema ea subjetividade dela (uma coisa engraçada para uma pessoa pode não ser engraçado - mesmo ofensiva - a outra)., Eu diria que é uma tarefa impossível
Você pode usar a mesma técnica que os filtros de spam. Em vez de spam / não-spam que você classificar com engraçado / não-engraçado. Olhe para classificadores bayesiana ingênuos para mais informações.
Além disso, tente Computacional Humor @ Google Scholar Se você é sério em entrar no campo. Sentiment Analysis foi mencionado também, veja wikipedia sobre isso.
Claro, isso tudo depende do que o seu âmbito e objectivos são ...