如何在列表中找到子列表的索引?

时间:2010-08-20 09:41:48

标签: c# .net

我正在寻找一种有效的方法(在.NET中),如何查找某些字节列表中是否存在字节序列,以及是否存在第一个启动的索引。

例如,假设我有:

var sequence = new List<byte> { 5, 10, 2 };
var listOne = new List<byte> { 1, 3, 10, 5, 10, 2, 8, 9 };
var listTwo = new List<byte> { 1, 3, 10, 5, 2, 10, 8, 9 };

结果应该是我的序列在listOne中的索引3和listTwo中的索引-1(即它不存在)上。

当然我可以通过int和每个索引遍历列表int并搜索以下数字是否与我的序列匹配,但是是否有更有效的方法(例如使用扩展方法)?

3 个答案:

答案 0 :(得分:6)

这与子字符串搜索基本上是一样的问题(实际上,顺序有效的列表是“字符串”的概括)。

幸运的是,计算机科学经常长期考虑这个问题,所以你要站在巨人的肩膀上。

看看文献。一些合理的起点是:

http://en.wikipedia.org/wiki/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm

http://en.wikipedia.org/wiki/Boyer%E2%80%93Moore_string_search_algorithm

http://en.wikipedia.org/wiki/Rabin-karp

即使只是维基百科文章中的伪代码也足以轻松移植到C#。查看不同情况下的性能描述,并确定代码最可能遇到的情况。 (我正在考虑你所说的关于搜索键列表的第一个简短的说法。)

答案 1 :(得分:5)

我认为最干净的方法是创建一个像这样的通用扩展方法:

public static int SubListIndex<T>(this IList<T> list, int start, IList<T> sublist)
{
    for (int listIndex = start; listIndex < list.Count - sublist.Count + 1; listIndex++)
    {
        int count = 0;
        while (count < sublist.Count && sublist[count].Equals(list[listIndex + count]))
            count++;
        if (count == sublist.Count)
            return listIndex;
    }
    return -1;
}

以这种方式打电话:

var indexOne = listOne.SubListIndex(0, sequence);
var indexTwo = listTwo.SubListIndex(0, sequence);

P.S。 如果您需要搜索更多的子列表出现次数,您也可以从给定的索引开始

答案 2 :(得分:1)

我建议将每个List<int>转换为String,然后使用String.IndexOf(sequence)进行搜索,以确定序列的位置和位置。