我想使用parquet-tools-1.8.1.jar仅在某个文本文件中转储特定列。但是无法这样做。我正在尝试下面的命令。请注意我的列名称有正斜杠。
parquet-tools-1.8.1.jar dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text
答案 0 :(得分:0)
运行
hadoop jar parquet-tools-1.8.1.jar parquet.tools.Main dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text
答案 1 :(得分:0)
请使用以下内容:
hadoop jar parquet-tools-1.8.1.jar dump -c dir1 log1 job12121 -m / hdfs-path / to / parquet file with space.parquet>> /home/local/parquet/output.text
注意:输入参数没有单引号。