检查子复制品

时间:2011-02-26 14:50:00

标签: c# duplicates console-application

我的控制台应用程序将遍历每个用户以获取他们的网站,以便它可以获取它们的新屏幕截图。但是,为了防止两次截取同一网站的截图,我必须检查是否已经截取了该网站的截图,同时循环浏览其他用户网站。

我目前的解决方案是:

数据库:

User
|--> ID: 1
|--> FirstName: Joe

|--> ID: 2
|--> FirstName: Stranger

Websites
|--> ID: 1
|--> UserID: 1
|--> URL: http://site.com

|--> ID: 2
|--> UserID: 2
|--> URL: http://site.com

控制台应用:

static void RenewWebsiteThumbNails()
{
    Console.WriteLine("Starting renewal process...");

    using (_repository)
    {
        var websitesUpdated = new List<string>();

        foreach (var user in _repository.GetAll())
        {
            foreach (var website in user.Websites.Where(website => !websitesUpdated.Contains(website.URL)))
            {
                _repository.TakeScreenDumpAndSave(website.URL);
                websitesUpdated.Add(website.URL);

                Console.WriteLine(new string('-', 50));
                Console.WriteLine("{0} has successfully been renewed", website.URL);
            }
        }
    }
}

但是,为这样的场景声明List似乎是错误的,只是为了检查是否已经添加了特定的URL ...对于替代方式的任何建议?

1 个答案:

答案 0 :(得分:2)

您可以使用

 var websitesUpdated = new HashSet<string>();

在列表情况下操作O(1)而不是O(n)的成本。

编辑: 顺便说一句,我会从每个用户获取所有url并将它们全部放在一个HashSet中,这样就不会有任何重复,然后只是迭代HashSet,因为它是一个简单的列表。

有些人这样认为。

var websites = new HashSet<string>();
foreach (var url in   _repository.GetAll().SelectMany(user=>user.Websites))
  websites.Add(url);

在此之后,

foreach (var website in websites)
{
Console.WriteLine(new string('-', 50)); 
Console.WriteLine("{0} has successfully been renewed",website.URL);
}