我一直致力于一个程序,其中包括在字符串中搜索重复模式。 查找和计算每种模式类型的匹配是很容易的部分,我可以根据找到的匹配数从最高得分到最低得分进行排序。 选择要保留哪些重叠匹配有点困难,我应该删除最左边还是最右边的?
让我们说我发现了第一场比赛并删除了最重叠的比赛,依此类推。当我转到下一个模式类型并发现最好从上面的模式类型中删除最左边的匹配时,会出现问题。这将允许这种模式适应空间等。 然而,当我进入下一组模式时,可能会发现留下它们第一次受益的东西等等......
这种来回摆动可能会重复整个文件。
我的问题是:是否有任何算法或技术可以计算最适合每种模式,同时保持列表顶部最重复的模式?
非常感谢任何建议;) 编
答案 0 :(得分:0)
尝试展示一个例子
你应该做的唯一事情是(在我看来):
- 而不是删除最左边或最右边的,尝试将它们全部保存,在分析完所有匹配后,你应该决定做什么。不确定地删除不是一个好的选择。