有没有办法进行分类的一个特别句/第作为有趣。只有很少的指针为其中一个应该更进一步。

有帮助吗?

解决方案

还有研究这个,这就是所谓的 计算幽默.这是一个跨学科的领域,需要元素计算的语言学、心理语言学、人工智能机械学等。他们正在试图找出它是什么,让故事,或者有趣的笑话(例如意外连接,或使用一个禁忌的话题,在一个令人惊讶的方式等等),并将其应用到文本(无论是产生一个有趣的故事,或为测量'"好笑"'的文本)。

还有 书籍 和文章(例如通过 格雷姆*里奇).

其他提示

是的,你应该使用训练库建立能够检测搞笑句子的预测模型。有时这被称为文献“情感分析”。看看这篇文章关于与LingPipe 情感分析

如果您可以使用Java,您可以使用自己的库(见许可证矩阵)。我发现它是非常有用的,不完全是在同样的情况下比你。

要退出这个功能的唯一方法是让一对夫妇一千人(猴子不会做,对不起)经过数千有趣的句子/故事来看待,评价他们,然后建立某种形式的专家系统/神经的网络出来。鉴于这个问题的范围和它的主观性(有趣的一个人的事情可能不是可笑 - 甚至反感 - 到另一个),我会说这是一个不可能完成的任务。

可以使用相同的技术为垃圾邮件过滤器。相反,垃圾邮件/非垃圾邮件的分类,你在逗/不好笑。考虑朴素贝叶斯分类器以获取更多信息。

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

此外,尝试计算幽默@谷歌学术的,如果你是认真的关于进入的领域。情感分析已经提到过,见维基百科上。

当然,这一切都取决于你的范围和目的是......

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top