比较两个数据表并格式化结果

时间:2012-05-13 02:28:44

标签: c# asp.net datatable asp.net-4.0

我知道如何在sql中执行此操作,但对于c#..我无法弄清楚如何比较两个数据表。

让我们说:

第一个数据表:

Name  |  Balance | Description
Smith |   1200   | Smith owes 600
Jordan|   4000   | Hi Jordan
Brooks|   5000   | I like my cat
Navaro|   6000   | description here
Gates |   9010   | omg

第二个数据表:

Name  |  Balance | Description
Smith |   1600   | Smith owes 600
Jordan|   4200   | I'M JORDAN
Clay  |   9000   | Test description
Brooks|   5000   | I like my cat

我想将比较结果转储到一个简单的html表中。

Soooo ......结果应该是这样的:
enter image description here

基本上我需要的是:

  
      
  1. 显示不同的列并显示数据

  2.   
  3. 如果所有列都相同,则不显示记录

  4.   
  5. 显示仅存在于第一个数据表(仅名称)

  6. 中的记录   
  7. 显示仅存在于第二个数据表中的记录(仅名称)

  8.   

在sql中,您可以执行类似merge,然后使用pivot。

但在C#中, 我的发现: 我可以使用except或intersect,但它返回一个dattable。除了\ intersection函数之外是否有任何格式化选项?

我正在寻找有关如何以最佳方式实现这一目标的建议。 (每个数据表中大约有100列)。所有这些都应该按名称进行比较。

1 个答案:

答案 0 :(得分:3)

以下是.cs文件中需要的代码......

(我只创建了这两个空类,以避免使用代码Dictionary<object, Dictionary<string, Tuple<object, object>>>,但如果您愿意,可以替换它)

protected class Differences : Dictionary<object, RowDifferences>
{
}

protected class RowDifferences : Dictionary<string, Tuple<object, object>>
{
}

protected Differences GetDifferences(DataTable table1,
                                     DataTable table2,
                                     out IEnumerable<object> onlyIn1,
                                     out IEnumerable<object> onlyIn2)
{
    var arr1 = new DataRow[table1.Rows.Count];
    var arr2 = new DataRow[table2.Rows.Count];

    table1.Rows.CopyTo(arr1, 0);
    table2.Rows.CopyTo(arr2, 0);

    onlyIn1 = arr1.Where(x1 => arr2.All(x2 => x1[0] != x2[0])).Select(dr => dr[0]);
    onlyIn2 = arr2.Where(x1 => arr1.All(x2 => x1[0] != x2[0])).Select(dr => dr[0]);

    var differences = new Differences();

    foreach (var x1 in arr1)
    {
        foreach (var x2 in arr2)
        {
            if (x1[0] == x2[0])
            {
                var rowDifferences = new RowDifferences();

                for (var i = 1; i < x1.ItemArray.Length; i++)
                {
                    if (x1.ItemArray[i] != x2.ItemArray[i])
                    {
                        rowDifferences.Add(table1.Columns[i].ColumnName,
                                           new Tuple<object, object>(x1.ItemArray[i], x2.ItemArray[i]));
                    }
                }

                differences.Add(x1[0], rowDifferences);
            }
        }
    }

    return differences;
}

protected void GenerateTables(out DataTable table1, out DataTable table2)
{
    table1 = new DataTable();
    table2 = new DataTable();

    table1.Columns.Add("Name");
    table1.Columns.Add("Balance");
    table1.Columns.Add("Description");

    table2.Columns.Add("Name");
    table2.Columns.Add("Balance");
    table2.Columns.Add("Description");

    table1.Rows.Add("Smith", 1200, "Smith owes 600");
    table1.Rows.Add("Jordan", 4000, "Hi Jordan");
    table1.Rows.Add("Brooks", 5000, "I like my cat");
    table1.Rows.Add("Navaro", 6000, "description here");
    table1.Rows.Add("Gates", 9010, "omg");

    table2.Rows.Add("Smith", 1600, "Smith owes 600");
    table2.Rows.Add("Jordan", 4200, "I'M JORDAN");
    table2.Rows.Add("Clay", 9000, "Test description");
    table2.Rows.Add("Brooks", 5000, "I like my cat");
}

这是一个如何在.aspx文件中构建表的示例:

<%
    DataTable table1, table2;
    GenerateTables(out table1, out table2);

    IEnumerable<object> onlyIn1, onlyIn2;
    var differences = GetDifferences(table1, table2, out onlyIn1, out onlyIn2);
%>

<table>
    <thead>
        <tr>
            <th>Name</th> 
            <th>RecordName</th> 
            <th>1st Datatable</th> 
            <th>2nd Datatable</th> 
        </tr>
    </thead>
    <tbody>
        <%
            foreach (var difference in differences)
            {
        %>
        <tr>
            <td><%=difference.Key%></td>
        </tr>
        <%
                foreach (var rowDifferences in difference.Value)
                {
        %>
        <tr>
            <td></td>
            <td><%=rowDifferences.Key%></td>
            <td><%=rowDifferences.Value.Item1%></td>
            <td><%=rowDifferences.Value.Item2%></td>
        </tr>
        <%
                }
            }
        %>
        <tr>
            <td>Only 1st datatable</td>
        </tr>
        <%
            foreach (var name in onlyIn1)
            {
        %>
        <tr>
            <td><%=name%></td>
        </tr>
        <%
            }
        %>
        <tr>
            <td>Only 2st datatable</td>
        </tr>
        <%
            foreach (var name in onlyIn2)
            {
        %>
        <tr>
            <td><%=name%></td>
        </tr>
        <%
            }
        %>
    </tbody>
</table>

根据您的意愿设置表格的样式从现在开始不应该很难。

所以你要留下的主要内容是将GenerateTables更改为某些查询逻辑,甚至将其置于GetDifferences内。

寻找算法可能已经完善。在最坏的情况下,它目前是O(m * n * k),m和n分别是table1和table2中的行数,k是列数。我已经可以想办法改进它了,但我会留给你。这应该让你开始变得更好。

请注意,此算法假定两个表之间的列相等。

如果对解决方案有什么不清楚的话,请告诉我,祝你好运!