从数据流中查找趋势主题

时间:2009-06-16 21:15:24

标签: keyword

查找单个单词趋势很简单,您可以对数据流中的每个单词进行分块并进行计数并将其限制为最后24小时或48小时。我不确定如何找到2字或3字组合的趋势? 任何帮助都是适用的

1 个答案:

答案 0 :(得分:0)

所以你有一些东西 - 对于单字案例 - 它说的是:

while (true)
    word = readNextWord()
    register(word, now)
    discardWordsOlderThan (now - windowSize)

只需跟踪上一个字:

while (true)
    word = readNextWord()
    register(prev + " " + word, now)
    prev = word
    discardWordsOlderThan (now - windowSize)