我正在尝试使用parquet-tools.jar(https://github.com/Parquet/parquet-mr/tree/master/parquet-tools)从镶木地板文件中打印一列。 我正在使用这个命令:
java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME someParquet.parquet
但我明白了:
Invalid arguments: missing required arguments
usage: parquet-dump [option...] <input>
where option is one of:
-c,--column <arg> Dump only the given column, can be specified more than
once
-d,--disable-data Do not dump column data
--debug Enable debug output
-h,--help Show this help string
-m,--disable-meta Do not dump row group and page metadata
--no-color Disable color output even if supported
where <input> is the parquet file to print to stdout
不确定我的语法错误。
答案 0 :(得分:3)
选项-c, - 列认为你已经指定了多个列作为“dump”commnad的参数,并最终吃掉所有参数。因此,您将看到缺少的需求参数异常。
一种解决方法,我可以建议你在-c选项之后添加一个额外的选项。这将使CLI解析器停止为-c选项吃掉意外的参数。
使用Below命令(添加了--debug选项),您应该能够执行程序:
java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME --debug someParquet.parquet
您也可以尝试使用--no-color而不是--debug。
希望这有帮助。