使用CSVKIT导出具有计数的唯一值列表

时间:2017-12-06 23:43:40

标签: python batch-processing csvkit

我已经开始使用CSVKIT,我已经学到了很多关于如何使用它以及操作数据的方法,但我仍在努力获得所有概念。最近我被要求根据列中的所有唯一值生成记录计数。我知道这可以使用Excel完成,但我想找到Excel以外的东西,我需要创建一个VBA脚本,因为我必须在多个文件上批量处理它。

使用CSVKIT我得到了以下内容:

CSVSTAT -c 1 -uniq test.csv> test_report.csv

这只告诉我唯一值的数量,而不是它们的名称,而不是每个唯一值的计数。有一次,我有价值而不是数量,但我现在不知所措。任何能指出我正确方向的人都会非常感激。

1 个答案:

答案 0 :(得分:0)

使用SQL,csvsql

csvsql -I --query "select yourfield, count(*) as count from filename group by yourfield order by count DESC" filename.csv