我对使用csvstat来获取通过bash循环传递到csvstat
的所有列的长度统计信息感兴趣。我正在运行的命令具有以下语法:
find /data/stuff \
-name 'name like this *.csv' \
-or -name 'name like that *.csv' \
-print0 | xargs \
--verbose \
-0 -I {} /where_csvkit_resides/bin/csvstat \
--verbose \
--len {}
我的结果与下面的摘录相对应:
ProbablyInteger: None
Name: 100
...
ProbablyInteger
的长度为None
。这是无稽之谈,因为此列的长度不能为无。我猜是following the official documentation:
打印CSV文件中所有列的描述性统计信息。将智能地确定每一列的类型,然后打印与该类型相关的分析(日期范围,整数的均值和中位数等):
csvstat
不会为该列生成长度值。
我很乐意考虑以下替代解决方案:
find
调用中实现产生与格式一致的结果
ColumnName: Length