我有一组(整数)输入值和一组期望值,例如
000033335502200008777 000033335552200007777
在这个示例中我有零输入,应该被忽略和非零输入组:
3333 555 22 7777
输入数据可以
对于每个这样的组我希望有这样的匹配率:
3333 (100%) 555 (66.67%) 22 (100%) 7777 (75%)
重点是我在每个小组的处理结束后立即需要这个比率:
first ratio after 8 values second ratio after 11 values third ratio after 13 values fourth ratio after 21 values
我应该选择哪种算法/方法?
提前谢谢!
答案 0 :(得分:1)
实际上,有一些来自计算生物学和遗传学的算法可能适用于快速数字匹配,也适用于序列模式挖掘领域。
检查" A FAST模式匹配算法"作者:S. S. Sheik,Sumit K. Aggarwal Anindya Poddar N. Balakrishnan,‡和K. Sekar
此外,您似乎可以从查看字符串组件之间匹配的算法中受益。
众所周知的有Smith-Waterman和Needleman-Wunsch。 对于直接字符串匹配,我建议调查Jaro-Winkler和Monge-Elkan。