为什么我的Linq GroupBy查询没有返回正确的计数值?

时间:2014-06-19 15:45:15

标签: c# linq csv datatable

以下代码将CSV文件读入DataTable。然后它循环遍历DataTable中的所有列,并尝试使用Linq查询生成每列中所有不同值的计数:

var g = allValues.AsEnumerable().GroupBy(i => i);

为什么" grp.Count()"即使我知道所有列都包含重复值,但值永远不会大于1?

        private void button13_Click(object sender, System.EventArgs e)
    {
        DataSet ds = GetDataFromCSVFile(-1);

        DataTable table = ds.Tables[0];

        int test = 0;
        string[] columnToSearch = { "" };

        IList<ColumnDetail> colDetails = new List<ColumnDetail>();

        foreach (DataColumn col in table.Columns)
        {
            columnToSearch[0] = col.ToString();

            DataTable allValues = GetAllValuesFromColumn(table, columnToSearch);

            var g = allValues.AsEnumerable().GroupBy(i => i);

            test = 0;
            foreach (var grp in g)
            {
                if (grp.Count() > 1)
                    MessageBox.Show(" grp.Key.ItemArray[0].ToString() : " + grp.Key.ItemArray[0].ToString() + " Cnt: " + grp.Count());
                test++;
            }
            MessageBox.Show("Count is: " + test);
        }
    }

1 个答案:

答案 0 :(得分:0)

Equals的{​​{1}}和GetHashCode方法不是基于每行的值,而是基于对象的引用。具有相同列值的两行不相等。您需要创建自定义DataRow以根据每列的值比较行。

在这种特殊情况下,已经以IEqualityComparer类的形式编写了一个合适的实现,因此在基于分组进行分组时,您可以使用DataRowComparer作为DataRowComparer.Default行的值而不是对行的引用。