从大型数据集中查找类似数据模式的有效方法

时间:2014-06-13 13:08:38

标签: algorithm large-data

我在数据库中有一个大型数据集(数百万条记录),简化示例如下: 6,1,3,5,2,3,4,5,6,7,9,3,1,3,5,4,6,3,4,6,4,5,7,4,5,0,8,... (millions records) 这里每个数字代表一行的键值。

我需要查找所有出现的1,3,5。直接的方法是迭代整个数据集并检查每次迭代中的三个连续行。

有更有效的算法吗?

1 个答案:

答案 0 :(得分:0)

如果您只需要找到3个元素子序列,最有效的方法是迭代整个数据。

很容易证明:您必须检查整个阵列的所有serching算法。

在此算法中,您最多执行3次。这是您可以获得的最佳复杂性。