在特定的推文集中定义趋势主题

时间:2011-04-08 18:02:41

标签: java twitter nlp trending

我正在做一个Java应用程序,我必须通过Twitter搜索确定从特定推文集合中的趋势主题是什么。在网上搜索时,我发现该算法定义了一个主题是趋势,当它在特定时间内有大量提及时,即在确切的时刻。因此必须进行衰减计算,以便主题经常变化。但是,我有另一个疑问:

Twitter如何确定推文中的哪些特定条款应该是TT?例如,我观察到大多数TT是主题标签或专有名词。这有意义吗?或者他们分析所有单词并确定频率?

我希望有人可以帮助我!谢谢!

2 个答案:

答案 0 :(得分:1)

我认为除了Twitter之外没有人知道,但似乎主题标签确实发挥了重要作用,但还有其他因素在起作用。我认为挖掘整个文本需要的时间比需要的多,并且会导致过多的误报。

以下是来自Mashable的感兴趣的文章:

http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf

-Ralph Winters

答案 1 :(得分:0)

您可能对meme tracking感兴趣,我记得,它使用专有名词做了有趣的事情,但基本上会识别流中的主题,因为它们变得越来越不受欢迎:

Eddi中,基于主题的交互式社交状态流浏览