应用错误收集

查找文本中最常用短语的列表

时间：2019-02-16 09:17:45

标签： string algorithm text analytics document

我正在尝试找到一种算法，该算法可以向我显示文本中最常用短语的顶部列表（包含1-2-3-4个单词或更多单词的短语）我尝试了很多方法，例如后缀数组，哈希映射，将单词传输到哈希整数值等等，但这总是给我带来O（n ^ 2）的复杂性。

对此解决方案或下限证明有何想法？

0 个答案:

没有答案