从String Array中删除List中的内容

时间:2013-10-23 12:18:30

标签: c# arrays list

我有一个String Array x和一个List y,我想从List X中删除Y中的所有数据,如何以最快的方式做到这一点?

例如为: X: 1)“aaa.bbb.ccc” 2)“ddd.eee.fff” 3)“ggg.hhh.jjj”

Y: 1)“bbb” 2)“fff”

结果应该是一个新的列表,其中只有3)存在,因为X.1被Y.1删除而X.2被Y.2删除

怎么做?

我知道我可以在列表X上做一个foreach并检查列表Y中的所有内容,这是最快的方式吗?

5 个答案:

答案 0 :(得分:9)

方便将是

var Z = X.Where(x => !x.Split('.').Intersect(Y).Any()).ToList();

这与“最快”不一样。可能最快的(运行时)方式是使用令牌搜索,例如:

public static bool ContainsToken(string value, string token, char delimiter = '.')
{
    if (string.IsNullOrEmpty(token)) return false;
    if (string.IsNullOrEmpty(value)) return false;

    int lastIndex = -1, idx, endIndex = value.Length - token.Length, tokenLength = token.Length;
    while ((idx = value.IndexOf(token, lastIndex + 1)) > lastIndex)
    {
        lastIndex = idx;
        if ((idx == 0 || (value[idx - 1] == delimiter))
            && (idx == endIndex || (value[idx + tokenLength] == delimiter)))
        {
            return true;
        }
    }
    return false;
}

然后像:

var list = new List<string>(X.Length);
foreach(var x in X)
{
    bool found = false;
    foreach(var y in Y)
    {
        if(ContainsToken(x, y, '.'))
        {
            found = true;
            break;
        }
    }
    if (!found) list.Add(x);
}

此:

  • 不分配数组(Split的输出,params char[] Split的输出
  • 不会创建任何新的string个实例(用于Split的输出)
  • 不使用委托抽象
  • 没有捕获的范围
  • 使用struct的{​​{1}}自定义迭代器,而不是List<T>
  • class迭代器
  • 启动具有适当最差大小的新IEnumerable<T>以避免重新分配

答案 1 :(得分:1)

迭代X和Y确实是最快的选项,因为你有 Contains 约束。我真的没有看到任何其他方式。

它应该超过X foreach,因为您无法修改使用foreach进行迭代的集合。

所以选项可能是:

for (int counterX = 0; counterX < X.Length; counterX++)
{
    for(int counterY = 0; counterY < Y.Length; counterY++)
    {
        if (X[counterX].Contains(Y[counterY]))
        {
            X.RemoveAt(counterX--);
            counterY = Y.Length;
        }
    }
}

这应该这样做(请注意,此代码未经过测试)。

答案 2 :(得分:1)

我认为一种相当快速的方法是使用List的内置RemoveAll()方法:

List<string> x = new List<string>
{
    "aaa.bbb.ccc",
    "ddd.eee.fff",
    "ggg.hhh.jjj"
};

List<string> y = new List<string>
{
    "bbb",
    "fff"
};

x.RemoveAll(s => y.Any(s.Contains));

(请注意,我假设您有两个列表,x和y。您的OP提到了一个字符串数组但后来继续讨论“List X”和“List Y”,所以我忽略了字符串数组位。)

答案 3 :(得分:1)

使用Aggregate函数

尝试此操作
    var xArr = new string[] { "aaa.bbb.ccc", "ddd.eee.fff", "ggg.hhh.jjj" };
    var yList = new List<string> { "bbb", "fff" };

    var result = xArr.Aggregate(new List<string> { }, (acc, next) =>
    {
        var elems = next.Split('.');
        foreach (var y in yList)
            if (elems.Contains(y))
                return acc;
        acc.Add(next);
        return acc;
    });

答案 4 :(得分:0)

如果你有一个相对较小的清单,那么性能后果并不是什么大不了的事。这是我能想到的最简单的foreach解决方案。

List<string> ListZ = ListX.ToList();

foreach (string x in ListX)
{
    foreach (string y in ListY)
    {
        if (x.Contains(y))
            ListZ.Remove(x);
    }
}