NLP将句子/段落分类为有趣

时间:2009-02-14 11:14:01

标签: nlp classification

有没有办法将特定句子/段落归类为有趣。关于应该在何处进一步研究这一点的指针非常少。

5 个答案:

答案 0 :(得分:8)

有关于此的研究,它被称为Computational Humor。这是一个跨学科领域,从计算语言学,心理语言学,人工智能,机器学习等方面获取元素。他们试图找出使故事或笑话变得有趣的内容(例如意外的联系,或以令人惊讶的方式使用禁忌主题)等)并将其应用于文本(要么生成有趣的故事,要么衡量文本的“有趣”)。

books和关于它的文章(例如Graeme Ritchie)。

答案 1 :(得分:5)

是的,您应该使用Training Corpora来构建能够检测有趣句子的预测模型。有时这在文献中被称为“情感分析”。请查看有关Sentiment Analysis with LingPipe

的这篇文章

如果您可以使用Java,则可以使用他们的库(请参阅license matrix)。我发现它非常有用,并不完全与你相同。

答案 2 :(得分:0)

解决这个问题的唯一方法就是让几千人(猴子不会做,对不起)来浏览数以千计的有趣句子/故事,评价它们,然后构建某种专家系统/神经网络出来了。鉴于问题的范围和主观性(对一个人来说有趣的事情可能不是很有趣 - 甚至是冒犯性的 - 对另一个人来说),我会说这是一项不可能完成的任务。

答案 3 :(得分:0)

您可以使用与垃圾邮件过滤器相同的技术。而不是垃圾邮件/非垃圾邮件,你可以分类为搞笑/不搞笑。查看朴素贝叶斯分类器以获取更多信息。

http://en.wikipedia.org/wiki/Naive_Bayesian_classification

答案 4 :(得分:0)

另外,如果您认真考虑进入该领域,请尝试Computational Humor @ Google Scholar。还提到了情感分析,请参阅wikipedia

当然,这完全取决于你的范围和目标......