找出数组

时间:2016-03-03 07:24:44

标签: php c arrays sorting sequences

我有一个任务,我有三个阵列A,B,C。所有包含相同的数据。为简单起见,假设数据是数字1到5.数据将是不同的混乱序列。我想找出B& C哪个数组的数据与A最相似。

Eg: 
A = 1,2,3,4,5
B = 1,2,3,5,4
C = 4,1,2,3,5

在这种情况下,很容易在视觉上理解B与A更相似。但是对于真正混乱的序列来说它变得更加复杂。

Eg: 
A = 1,2,3,4,5
B = 5,3,1,4,2
C = 4,1,2,3,5

在这种情况下,我会假设C更接近A.我认为这个假设可以量化为:两个数组中有多少个元素具有相同的序列?在上面的例子中,[1,2,3]的子序列在两个数组中都是相同的。第二个问题是类似子序列之间的偏移差异是什么?在这种情况下,它是1,因为子序列从A的索引0和C的索引1开始。

所以匹配序列中的元素数量及其偏移量是我想要使用的。我计划为这两个实体添加权重(匹配序列中的元素数量,以及它们出现时的偏移差异)

这有意义吗?我只需粗略近似相似性,结果不需要精确。是否有任何正式的数学或数据结构模型可以解决这个问题?

BTW,我需要实现的项目是PHP。它是否有任何内置函数,如用于字符串差异的levenstein模型?

非常欢迎任何建议!

1 个答案:

答案 0 :(得分:1)

嗯,我想你可以提出自己的算法(例如生成所有后缀,然后搜索它们,然后定义评分程序),或者你可以使用一个众所周知的算法,如
Smith-Waterman用于本地对齐,或Needleman-Wunsch用于全局对齐。这些算法的优点在于它们易于理解并为您提供所有可能的对齐(您可以根据自己的情况选择最佳对齐方式)。

NW in PHP

SW in PHP