datamash:处理列

时间:2019-03-29 19:12:58

标签: bash statistics

我正在使用datamash来评估价格数据列。在浏览man页时,我看不到任何处理以下问题的明确途径。

The Viridian convict / by York, Sam,    YORK    B       F       15.00   15.00
Show me a mountain / by Young, Kerry,   YOUNG   B       F       27.00   27.00
Eve / by Young, William P.      YOUNG   B       F       27.00   27.00
The gates of Evangeline / by Young, Hester.     YOUNG   B       F       26.00   26.00
Meddling and murder / by Yu, Ovidia,    YU      B       F       
Vision of the future / by Zahn, Timothy.        ZAHN    B       F       8.00    8.00
Star wars. by Zahn, Timothy,    ZAHN    B       F       
Wicked bite / by Zanetti, Rebecca,      ZANETTI B       F       15.00   15.00

请注意2列中缺少的值。我还没有找到一种方法datamash来处理缺失值,而无需使用其他工具进行预处理。

例如。

awk -F'\t' '$6 != "" {print $6}' print.csv | datamash mean 1 sstdev 1 median 1

--narm选项似乎很有希望,但完全没有帮助。我得到以下信息:

  

datamash:第1行第6栏的无效数值:''

如果需要的话,我可以继续使用管道,但是我是这个工具的新手,并且怀疑有更简单的方法。

0 个答案:

没有答案