标签: data-structures
我想从大词序列中找到前K个常用词。请帮我为这个
答案 0 :(得分:0)
按空格或任何分隔符将字符串拆分为字符串数组,然后将其放入HashMultiset
然后你可以简单地得到每个单词的计数。
答案 1 :(得分:0)
我会在这里使用大小为k的最小堆而不是哈希表。只需在堆中添加各自长度的单词 - 一旦堆中有k + 1项,删除最小项并重新调整。总体努力将是O(n * log(k))并且您将需要O(k)额外空间(以维持堆)。
k