目前我的对象包含两个字符串:
class myClass
{
public string string1 { get; set; }
public string string2 { get; set; }
public bool MatcheString1(string newString)
{
if (this.string1 == newString)
{
return true;
}
return false;
}
}
然后我有了第二个类,它使用List生成上述对象的列表。
class URLs : IEnumerator, IEnumerable
{
private List<myClass> myCustomList;
private int position = -1;
// Constructor
public URLs()
{
myCustomList = new List<myClass>();
}
}
在那个班级中,我正在使用一种方法来检查列表中是否存在字符串
// We can also check if the URL string is present in the collection
public bool ContainsString1(string newString)
{
foreach (myClass entry in myCustomList)
{
if (entry. MatcheString1(newString))
{
return true;
}
}
return false;
}
基本上,随着对象列表增长到100,000标记,此过程变得非常缓慢。什么是检查该字符串是否存在的快速方法?我很高兴在类之外创建一个List进行验证,但这对我来说似乎很骇人听闻?
答案 0 :(得分:5)
一旦项目列表稳定,您就可以计算匹配的哈希集,例如:
// up-front work
var knownStrings = new HashSet<string>();
foreach(var item in myCustomList) knownStrings.Add(item.string1);
(请注意,这不是免费的,需要在列表更改时重新计算);然后,稍后,你可以检查:
return knownStrings.Contains(newString);
然后非常便宜(O(1)而不是O(N))。
答案 1 :(得分:2)
如果您不介意使用其他数据结构而不是列表,则可以使用字典,其中您的对象由string1
属性编制索引。
public URLs()
{
myDictionary = new Dictionary<string, myClass>();
}
由于Dictionary<TKey, TValue>
可以通常 find elements in O(1) time,因此您可以非常快速地执行该检查。
if(myDictionary.ContainsKey(newString))
//...
答案 2 :(得分:0)
搜索排序数组(列表)需要O(logN)
var sortedList = new SortedSet<string>();
sortedList.Add("abc");
// and so on
sortedList.Contains("test");
通过HashSet搜索需要O(1),但我想是在100k元素的情况下(Log(100000)= 5),并且几乎没有差异占用更多内存的HashSet。