以下代码将CSV文件读入DataTable。然后它循环遍历DataTable中的所有列,并尝试使用Linq查询生成每列中所有不同值的计数:
var g = allValues.AsEnumerable().GroupBy(i => i);
为什么" grp.Count()"即使我知道所有列都包含重复值,但值永远不会大于1?
private void button13_Click(object sender, System.EventArgs e)
{
DataSet ds = GetDataFromCSVFile(-1);
DataTable table = ds.Tables[0];
int test = 0;
string[] columnToSearch = { "" };
IList<ColumnDetail> colDetails = new List<ColumnDetail>();
foreach (DataColumn col in table.Columns)
{
columnToSearch[0] = col.ToString();
DataTable allValues = GetAllValuesFromColumn(table, columnToSearch);
var g = allValues.AsEnumerable().GroupBy(i => i);
test = 0;
foreach (var grp in g)
{
if (grp.Count() > 1)
MessageBox.Show(" grp.Key.ItemArray[0].ToString() : " + grp.Key.ItemArray[0].ToString() + " Cnt: " + grp.Count());
test++;
}
MessageBox.Show("Count is: " + test);
}
}
答案 0 :(得分:0)
Equals
的{{1}}和GetHashCode
方法不是基于每行的值,而是基于对象的引用。具有相同列值的两行不相等。您需要创建自定义DataRow
以根据每列的值比较行。
在这种特殊情况下,已经以IEqualityComparer
类的形式编写了一个合适的实现,因此在基于分组进行分组时,您可以使用DataRowComparer
作为DataRowComparer.Default
行的值而不是对行的引用。