运行parquet-tools jar的参数无效

时间:2016-11-18 18:47:04

标签: java jar parquet

我正在尝试使用parquet-tools.jar(https://github.com/Parquet/parquet-mr/tree/master/parquet-tools)从镶木地板文件中打印一列。 我正在使用这个命令:

java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME someParquet.parquet

但我明白了:

Invalid arguments: missing required arguments

usage: parquet-dump [option...] <input>
where option is one of:
    -c,--column <arg>  Dump only the given column, can be specified more than
                       once
    -d,--disable-data  Do not dump column data
       --debug         Enable debug output
    -h,--help          Show this help string
    -m,--disable-meta  Do not dump row group and page metadata
       --no-color      Disable color output even if supported
where <input> is the parquet file to print to stdout

不确定我的语法错误。

1 个答案:

答案 0 :(得分:3)

选项-c, - 列认为你已经指定了多个列作为“dump”commnad的参数,并最终吃掉所有参数。因此,您将看到缺少的需求参数异常。

一种解决方法,我可以建议你在-c选项之后添加一个额外的选项。这将使CLI解析器停止为-c选项吃掉意外的参数。

使用Below命令(添加了--debug选项),您应该能够执行程序:

java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME --debug someParquet.parquet

您也可以尝试使用--no-color而不是--debug。

希望这有帮助。