根据单词的频率在twits中查找热门话题

时间:2012-11-20 06:54:52

标签: java twitter data-mining text-mining

我正在构建一个Java Web服务,用于根据在twits中使用的单词的频率在特殊位置(纬度,经度)中查找热门主题。

我使用twitter4j api获取twits,我可以用它们的位置过滤它们。 任何人都可以帮助我并告诉我如何处理数据并获得热门话题?

我真的很感激。

1 个答案:

答案 0 :(得分:2)

我建议你研究一下“概率潜在语义索引”。您可以使用“topicmodels”包。

此视频可能对您有用:Video on Probabilistic latent semantic indexing