如何使用c#增加循环的性能

时间:2017-09-18 11:49:41

标签: c# ms-project

我使用嵌套的for循环比较来自Microsoft项目的任务数据。但由于该项目有很多记录(超过1000个),因此速度很慢。

如何改善效果?

for (int n = 1; n < thisProject.Tasks.Count; n++) 
{
    string abc = thisProject.Tasks[n].Name;
    string def = thisProject.Tasks[n].ResourceNames;
    for (int l = thisProject.Tasks.Count; l > n; l--) 
    {
        // MessageBox.Show(thisProject.Tasks[l].Name);
        if (abc == thisProject.Tasks[l].Name && def == thisProject.Tasks[l].ResourceNames) 
        {
            thisProject.Tasks[l].Delete();
        }
    }
}

正如您所注意到的那样,我正在比较个人Name上的ResourceNamesTask,当我发现重复时,我致电Task.Delete以删除重复内容

4 个答案:

答案 0 :(得分:1)

在这种情况下,哈希检查应该快得多,然后是嵌套循环,即O(n)vs O(n ^ 2)

首先,提供您自己的等式比较器

class TaskComparer : IEqualityComparer<Task> {
    public bool Equals(Task x, Task y) {
        if (ReferenceEquals(x, y)) return true;
        if (ReferenceEquals(x, null)) return false;
        if (ReferenceEquals(y, null)) return false;
        if (x.GetType() != y.GetType()) return false;
        return string.Equals(x.Name, y.Name) && string.Equals(x.ResourceNames, y.ResourceNames);
    }

    public int GetHashCode(Task task) {
        unchecked {
            return 
                ((task?.Name?.GetHashCode()         ?? 0) * 397) ^ 
                 (task?.ResourceNames?.GetHashCode() ?? 0);
        }
    }
}

不要过分担心GetHashCode函数的实现;这只是一个肉鸡板代码,它从其属性组成一个唯一的哈希码

现在您有了这个类进行比较和散列,您可以使用以下代码删除您的欺骗

var set = new HashSet<Task>(new TaskComparer());
for (int i = thisProject.Tasks.Count - 1; i >= 0; --i) {
    if (!set.Add(thisProject.Tasks[i]))
        thisProject.Tasks[i].Delete();
}

正如您所注意到的,您只需扫描所有元素,同时将它们存储到HashSet中。这个HashSet将根据我们的相等比较器检查提供的元素是否重复。

现在,由于您要删除它,因此会删除检测到的欺骗。您可以修改此代码,只需提取Unique项而不是删除欺骗,方法是将条件反转为if (set.Add(thisProject.Tasks[i]))并在此if

内处理

答案 1 :(得分:1)

Microsoft Project有一个Sort方法,可以解决这个问题。按名称,资源名称和唯一ID对任务进行排序,然后循环比较相邻任务并删除重复项。通过使用唯一ID作为第三个排序键,您可以确保删除稍后添加的副本。或者,您可以使用任务ID删除计划中较低的任务。这是VBA如何执行此操作的示例:

Sub RemoveDuplicateTasks()

    Dim proj As Project
    Set proj = ActiveProject

    Application.Sort Key1:="Name", Ascending1:=True, Key2:="Resource Names", Ascending2:=True, Key3:="Unique ID", Ascending3:=True, Renumber:=False, Outline:=False
    Application.SelectAll
    Dim tsks As Tasks
    Set tsks = Application.ActiveSelection.Tasks

    Dim i As Integer
    Do While i < tsks.Count
        If tsks(i).Name = tsks(i + 1).Name And tsks(i).ResourceNames = tsks(i + 1).ResourceNames Then
            tsks(i + 1).Delete
        Else
            i = i + 1
        End If
    Loop

    Application.Sort Key1:="ID", Renumber:=False, Outline:=False
    Application.SelectBeginning

End Sub

注意:这个问题涉及算法,而不是语法; VBA很容易转换为c#。

答案 2 :(得分:0)

这应该会为您提供所有重复的项目,因此您可以从原始列表中删除它们。

thisProject.Tasks.GroupBy(x => new { x.Name, x.ResourceNames}).Where(g => g.Count() > 1).SelectMany(g => g.Select(c => c));

请注意,您可能不希望删除所有这些,只删除重复版本,因此请小心如何遍历此列表。

答案 3 :(得分:0)

从您的任务列表中获取不同元素的Linq方法:

public class Task
{
    public string Name {get;set;}
    public string ResourceName {get;set;}
}

public class Program
{
    public static void Main()
    {
        List<Task> Tasks = new List<Task>();
        Tasks.Add(new Task(){Name = "a",ResourceName = "ra"});
        Tasks.Add(new Task(){Name = "b",ResourceName = "rb"});
        Tasks.Add(new Task(){Name = "c",ResourceName = "rc"});
        Tasks.Add(new Task(){Name = "a",ResourceName = "ra"});
        Tasks.Add(new Task(){Name = "b",ResourceName = "rb"});
        Tasks.Add(new Task(){Name = "c",ResourceName = "rc"});

        Console.WriteLine("Initial List :");
        foreach(var t in Tasks){
            Console.WriteLine(t.Name);  
        }

        // Here comes the interesting part
        List<Task> Tasks2 = Tasks.GroupBy(x => new {x.Name, x.ResourceName})
                                 .Select(g => g.First()).ToList();

        Console.WriteLine("Final List :");
        foreach(Task t in Tasks2){
            Console.WriteLine(t.Name);  
        }
    }
}

这会选择具有相同NameResourceName的所有第一个元素。

运行示例here