应用错误收集

时间：2014-11-30 20:53:35

标签： algorithm string-matching

我正在进行一项小型研究，在那里我寻找字符串匹配算法并实现它们，以便将一些先前的算法与最近发表的新颖算法进行比较，其中作者声称它的性能优于Boyer Moore算法

我的问题不是编码，而是更多地了解术语“字符权重”的含义，这里引用文章：

enter image description here

我已阅读所有论文，但该术语未在任何地方定义，我已阅读有关同一主题的其他论文，我无法提供任何有助于此术语无意义的内容。我已经通过电子邮件发送了作者，但我仍在等待回复。

可能是指ASCII码还是......？

更新

我觉得奇怪的是，作者没有指定时间和空间的复杂性，但他们确实提到了这个

“无论搜索模式的长度如何，搜索时间都是恒定的。与最着名的两种着名算法BM和Brute force相比，ELSM的性能非常高。平均消耗时间约为6％的   两个提到的算法消耗的时间。“

“实验结果表明，在最坏的情况下，新算法看起来比BM多次有效，且模式越长，性能改善越大”

答案 0 :(得分：2)

角色的重量表示其相对于其他角色的重要性。例如，“g”的权重可以为100，“e”的权重为50。

这个想法与weighted arithmetic mean的想法相同。分配给角色的权重是您必须决定的。

答案 1 :(得分：1)

我认为你的问题的答案是抽象的：

它基于计算搜索中字符值的总和字符串并将此总和与值的总和进行比较滑动窗口中的相应字符。滑动窗口包括字符数等于搜索字符串的字符数从输入的开头到结尾右移字符串。

这听起来非常简单地总结了ASCII值。我不知道这比Boyer Moore更好。