总是通过csvstat获取所有列的列长

时间:2018-07-12 15:45:49

标签: csv csvkit

我对使用csvstat来获取通过bash循环传递到csvstat的所有列的长度统计信息感兴趣。我正在运行的命令具有以下语法:

find /data/stuff                                   \
    -name 'name like this *.csv'                   \
    -or -name 'name like that *.csv'               \
    -print0 | xargs                                \
        --verbose                                  \
        -0 -I {} /where_csvkit_resides/bin/csvstat \
            --verbose                              \
            --len {}

我的结果与下面的摘录相对应:

ProbablyInteger: None
Name: 100
...

问题

ProbablyInteger的长度为None。这是无稽之谈,因为此列的长度不能为无。我猜是following the official documentation

  

打印CSV文件中所有列的描述性统计信息。将智能地确定每一列的类型,然后打印与该类型相关的分析(日期范围,整数的均值和中位数等):

csvstat不会为该列生成长度值。

问题

  • 是否可以强制 csvstat 始终生成长度值 猜出的列类型是什么?

  • 我很乐意考虑以下替代解决方案:

    • 可以在find调用中实现
    • 产生与格式一致的结果

      ColumnName: Length
      

0 个答案:

没有答案