字符串匹配 - 字符权重

时间:2014-11-30 20:53:35

标签: algorithm string-matching

我正在进行一项小型研究,在那里我寻找字符串匹配算法并实现它们,以便将一些先前的算法与最近发表的新颖算法进行比较,其中作者声称它的性能优于Boyer Moore算法

我的问题不是编码,而是更多地了解术语“字符权重”的含义,这里引用文章:

enter image description here

我已阅读所有论文,但该术语未在任何地方定义,我已阅读有关同一主题的其他论文,我无法提供任何有助于此术语无意义的内容。我已经通过电子邮件发送了作者,但我仍在等待回复。

可能是指ASCII码还是......?

以下是对该论文的引用: IEEE Paper - Exact anD Like String Matching (ELSM)

更新

我觉得奇怪的是,作者没有指定时间和空间的复杂性,但他们确实提到了这个

  

“无论搜索模式的长度如何,搜索时间都是恒定的。与最着名的两种着名算法BM和Brute force相比,ELSM的性能非常高。平均消耗时间约为6%的   两个提到的算法消耗的时间。“

     

“实验结果表明,在最坏的情况下,新算法看起来比BM多次有效,且模式越长,性能改善越大”

2 个答案:

答案 0 :(得分:2)

角色的重量表示其相对于其他角色的重要性。例如,“g”的权重可以为100,“e”的权重为50。

这个想法与weighted arithmetic mean的想法相同。分配给角色的权重是您必须决定的。

答案 1 :(得分:1)

我认为你的问题的答案是抽象的:

  

它基于计算搜索中字符值的总和   字符串并将此总和与值的总和进行比较   滑动窗口中的相应字符。滑动窗口   包括字符数等于搜索字符串的字符数   从输入的开头到结尾右移   字符串。

这听起来非常简单地总结了ASCII值。我不知道这比Boyer Moore更好。