用于文本中多个单词匹配的算法,计算每个匹配单词的数量

时间:2010-06-06 03:16:12

标签: string full-text-search matching

我注意到它有匹配给定文本中多个单词的解决方案,如下所示: Algorithm for multiple word matching in text

如果我想确切地知道文本中每个匹配单词的出现次数,我的解决方案是这样的:

步骤1:使用交流算法获取加工词;

第2步:计算在步骤1中获得的每个单词的数量

有更快的方法吗?

THX〜

1 个答案:

答案 0 :(得分:0)

  1. 将您要搜索的单词放在哈希表中,单词为键,值初始化为0.
  2. 迭代文本的单词,每次检查单词是否是哈希表中的键,如果是,则增加该键的值。
  3. 迭代哈希表查找非零值,这些键是您匹配的单词,值是计数。
  4. 在O(N + M)中运行,其中N是您正在搜索 的单词数,M是您正在搜索的单词数。