如果字符串存在于大型对象列表中,那么比较最快(性能)的方法是什么?

时间:2013-11-01 12:07:51

标签: c# string list

目前我的对象包含两个字符串:

class myClass
{
    public string string1 { get; set; }
    public string string2 { get; set; }

    public bool MatcheString1(string newString)
    {
        if (this.string1 == newString)
        {
            return true;
        }
        return false;
    }
}

然后我有了第二个类,它使用List生成上述对象的列表。

class URLs : IEnumerator, IEnumerable
{
    private List<myClass> myCustomList;
    private int position = -1;

    //  Constructor
    public URLs()
    {
        myCustomList = new List<myClass>();
    }
}

在那个班级中,我正在使用一种方法来检查列表中是否存在字符串

//  We can also check if the URL string is present in the collection
public bool ContainsString1(string newString)
{
    foreach (myClass entry in myCustomList)
    {
        if (entry. MatcheString1(newString))
        {
            return true;
        }
    }

    return false;
}

基本上,随着对象列表增长到100,000标记,此过程变得非常缓慢。什么是检查该字符串是否存在的快速方法?我很高兴在类之外创建一个List进行验证,但这对我来说似乎很骇人听闻?

3 个答案:

答案 0 :(得分:5)

一旦项目列表稳定,您就可以计算匹配的哈希集,例如:

// up-front work
var knownStrings = new HashSet<string>();
foreach(var item in myCustomList) knownStrings.Add(item.string1);

(请注意,这不是免费的,需要在列表更改时重新计算);然后,稍后,你可以检查:

return knownStrings.Contains(newString);

然后非常便宜(O(1)而不是O(N))。

答案 1 :(得分:2)

如果您不介意使用其他数据结构而不是列表,则可以使用字典,其中您的对象由string1属性编制索引。

public URLs()
{
    myDictionary = new Dictionary<string, myClass>();
}

由于Dictionary<TKey, TValue>可以通常 find elements in O(1) time,因此您可以非常快速地执行该检查。

if(myDictionary.ContainsKey(newString))
  //...

答案 2 :(得分:0)

搜索排序数组(列表)需要O(logN)

        var sortedList = new SortedSet<string>();
        sortedList.Add("abc");
        // and so on
        sortedList.Contains("test");

通过HashSet搜索需要O(1),但我想是在100k元素的情况下(Log(100000)= 5),并且几乎没有差异占用更多内存的HashSet。