我正在做一个Java应用程序,我必须通过Twitter搜索确定从特定推文集合中的趋势主题是什么。在网上搜索时,我发现该算法定义了一个主题是趋势,当它在特定时间内有大量提及时,即在确切的时刻。因此必须进行衰减计算,以便主题经常变化。但是,我有另一个疑问:
Twitter如何确定推文中的哪些特定条款应该是TT?例如,我观察到大多数TT是主题标签或专有名词。这有意义吗?或者他们分析所有单词并确定频率?
我希望有人可以帮助我!谢谢!
答案 0 :(得分:1)
我认为除了Twitter之外没有人知道,但似乎主题标签确实发挥了重要作用,但还有其他因素在起作用。我认为挖掘整个文本需要的时间比需要的多,并且会导致过多的误报。
以下是来自Mashable的感兴趣的文章:
http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf
-Ralph Winters
答案 1 :(得分:0)
您可能对meme tracking感兴趣,我记得,它使用专有名词做了有趣的事情,但基本上会识别流中的主题,因为它们变得越来越不受欢迎:
在Eddi中,基于主题的交互式社交状态流浏览