标签: java twitter data-mining text-mining
我正在构建一个Java Web服务,用于根据在twits中使用的单词的频率在特殊位置(纬度,经度)中查找热门主题。
我使用twitter4j api获取twits,我可以用它们的位置过滤它们。 任何人都可以帮助我并告诉我如何处理数据并获得热门话题?
我真的很感激。
答案 0 :(得分:2)
我建议你研究一下“概率潜在语义索引”。您可以使用“topicmodels”包。
此视频可能对您有用:Video on Probabilistic latent semantic indexing