实时数据匹配算法

时间:2014-12-19 18:05:37

标签: algorithm real-time matching

我有一组(整数)输入值和一组期望值,例如

000033335502200008777
000033335552200007777

在这个示例中我有零输入,应该被忽略和非零输入组:

3333
555
22
7777

输入数据可以

  1. 不同长度的组(550和555)
  2. 组班(0055500 0555000)
  3. 错误(但接近)值(8777和7777)
  4. 对于每个这样的组我希望有这样的匹配率:

    3333 (100%)
    555  (66.67%)
    22 (100%)
    7777 (75%)
    

    重点是我在每个小组的处理结束后立即需要这个比率:

    first ratio after 8 values
    second ratio after 11 values
    third ratio after 13 values
    fourth ratio after 21 values
    

    我应该选择哪种算法/方法?

    提前谢谢!

1 个答案:

答案 0 :(得分:1)

实际上,有一些来自计算生物学和遗传学的算法可能适用于快速数字匹配,也适用于序列模式挖掘领域。

检查" A FAST模式匹配算法"作者:S. S. Sheik,Sumit K. Aggarwal Anindya Poddar N. Balakrishnan,‡和K. Sekar

此外,您似乎可以从查看字符串组件之间匹配的算法中受益。

众所周知的有Smith-WatermanNeedleman-Wunsch。 对于直接字符串匹配,我建议调查Jaro-Winkler和Monge-Elkan。