我正在进行一项小型研究,在那里我寻找字符串匹配算法并实现它们,以便将一些先前的算法与最近发表的新颖算法进行比较,其中作者声称它的性能优于Boyer Moore算法
我的问题不是编码,而是更多地了解术语“字符权重”的含义,这里引用文章:
我已阅读所有论文,但该术语未在任何地方定义,我已阅读有关同一主题的其他论文,我无法提供任何有助于此术语无意义的内容。我已经通过电子邮件发送了作者,但我仍在等待回复。
可能是指ASCII码还是......?
以下是对该论文的引用: IEEE Paper - Exact anD Like String Matching (ELSM)
更新
我觉得奇怪的是,作者没有指定时间和空间的复杂性,但他们确实提到了这个
“无论搜索模式的长度如何,搜索时间都是恒定的。与最着名的两种着名算法BM和Brute force相比,ELSM的性能非常高。平均消耗时间约为6%的 两个提到的算法消耗的时间。“
“实验结果表明,在最坏的情况下,新算法看起来比BM多次有效,且模式越长,性能改善越大”
答案 0 :(得分:2)
角色的重量表示其相对于其他角色的重要性。例如,“g”的权重可以为100,“e”的权重为50。
这个想法与weighted arithmetic mean的想法相同。分配给角色的权重是您必须决定的。
答案 1 :(得分:1)
我认为你的问题的答案是抽象的:
它基于计算搜索中字符值的总和 字符串并将此总和与值的总和进行比较 滑动窗口中的相应字符。滑动窗口 包括字符数等于搜索字符串的字符数 从输入的开头到结尾右移 字符串。
这听起来非常简单地总结了ASCII值。我不知道这比Boyer Moore更好。