我知道如何在sql中执行此操作,但对于c#..我无法弄清楚如何比较两个数据表。
让我们说:
第一个数据表:
Name | Balance | Description
Smith | 1200 | Smith owes 600
Jordan| 4000 | Hi Jordan
Brooks| 5000 | I like my cat
Navaro| 6000 | description here
Gates | 9010 | omg
第二个数据表:
Name | Balance | Description
Smith | 1600 | Smith owes 600
Jordan| 4200 | I'M JORDAN
Clay | 9000 | Test description
Brooks| 5000 | I like my cat
我想将比较结果转储到一个简单的html表中。
Soooo ......结果应该是这样的:
基本上我需要的是:
显示不同的列并显示数据
如果所有列都相同,则不显示记录
- 中的记录
显示仅存在于第一个数据表(仅名称)
- 醇>
显示仅存在于第二个数据表中的记录(仅名称)
在sql中,您可以执行类似merge,然后使用pivot。
但在C#中, 我的发现: 我可以使用except或intersect,但它返回一个dattable。除了\ intersection函数之外是否有任何格式化选项?
我正在寻找有关如何以最佳方式实现这一目标的建议。 (每个数据表中大约有100列)。所有这些都应该按名称进行比较。
答案 0 :(得分:3)
以下是.cs文件中需要的代码......
(我只创建了这两个空类,以避免使用代码Dictionary<object, Dictionary<string, Tuple<object, object>>>
,但如果您愿意,可以替换它)
protected class Differences : Dictionary<object, RowDifferences>
{
}
protected class RowDifferences : Dictionary<string, Tuple<object, object>>
{
}
protected Differences GetDifferences(DataTable table1,
DataTable table2,
out IEnumerable<object> onlyIn1,
out IEnumerable<object> onlyIn2)
{
var arr1 = new DataRow[table1.Rows.Count];
var arr2 = new DataRow[table2.Rows.Count];
table1.Rows.CopyTo(arr1, 0);
table2.Rows.CopyTo(arr2, 0);
onlyIn1 = arr1.Where(x1 => arr2.All(x2 => x1[0] != x2[0])).Select(dr => dr[0]);
onlyIn2 = arr2.Where(x1 => arr1.All(x2 => x1[0] != x2[0])).Select(dr => dr[0]);
var differences = new Differences();
foreach (var x1 in arr1)
{
foreach (var x2 in arr2)
{
if (x1[0] == x2[0])
{
var rowDifferences = new RowDifferences();
for (var i = 1; i < x1.ItemArray.Length; i++)
{
if (x1.ItemArray[i] != x2.ItemArray[i])
{
rowDifferences.Add(table1.Columns[i].ColumnName,
new Tuple<object, object>(x1.ItemArray[i], x2.ItemArray[i]));
}
}
differences.Add(x1[0], rowDifferences);
}
}
}
return differences;
}
protected void GenerateTables(out DataTable table1, out DataTable table2)
{
table1 = new DataTable();
table2 = new DataTable();
table1.Columns.Add("Name");
table1.Columns.Add("Balance");
table1.Columns.Add("Description");
table2.Columns.Add("Name");
table2.Columns.Add("Balance");
table2.Columns.Add("Description");
table1.Rows.Add("Smith", 1200, "Smith owes 600");
table1.Rows.Add("Jordan", 4000, "Hi Jordan");
table1.Rows.Add("Brooks", 5000, "I like my cat");
table1.Rows.Add("Navaro", 6000, "description here");
table1.Rows.Add("Gates", 9010, "omg");
table2.Rows.Add("Smith", 1600, "Smith owes 600");
table2.Rows.Add("Jordan", 4200, "I'M JORDAN");
table2.Rows.Add("Clay", 9000, "Test description");
table2.Rows.Add("Brooks", 5000, "I like my cat");
}
这是一个如何在.aspx文件中构建表的示例:
<%
DataTable table1, table2;
GenerateTables(out table1, out table2);
IEnumerable<object> onlyIn1, onlyIn2;
var differences = GetDifferences(table1, table2, out onlyIn1, out onlyIn2);
%>
<table>
<thead>
<tr>
<th>Name</th>
<th>RecordName</th>
<th>1st Datatable</th>
<th>2nd Datatable</th>
</tr>
</thead>
<tbody>
<%
foreach (var difference in differences)
{
%>
<tr>
<td><%=difference.Key%></td>
</tr>
<%
foreach (var rowDifferences in difference.Value)
{
%>
<tr>
<td></td>
<td><%=rowDifferences.Key%></td>
<td><%=rowDifferences.Value.Item1%></td>
<td><%=rowDifferences.Value.Item2%></td>
</tr>
<%
}
}
%>
<tr>
<td>Only 1st datatable</td>
</tr>
<%
foreach (var name in onlyIn1)
{
%>
<tr>
<td><%=name%></td>
</tr>
<%
}
%>
<tr>
<td>Only 2st datatable</td>
</tr>
<%
foreach (var name in onlyIn2)
{
%>
<tr>
<td><%=name%></td>
</tr>
<%
}
%>
</tbody>
</table>
根据您的意愿设置表格的样式从现在开始不应该很难。
所以你要留下的主要内容是将GenerateTables
更改为某些查询逻辑,甚至将其置于GetDifferences
内。
寻找算法可能已经完善。在最坏的情况下,它目前是O(m * n * k),m和n分别是table1和table2中的行数,k是列数。我已经可以想办法改进它了,但我会留给你。这应该让你开始变得更好。
请注意,此算法假定两个表之间的列相等。
如果对解决方案有什么不清楚的话,请告诉我,祝你好运!