使用Parquet-tools.jar从Parquet文件中转移特定列

时间:2016-07-20 10:11:39

标签: hadoop parquet

我想使用parquet-tools-1.8.1.jar仅在某个文本文件中转储特定列。但是无法这样做。我正在尝试下面的命令。请注意我的列名称有正斜杠。

parquet-tools-1.8.1.jar dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text

2 个答案:

答案 0 :(得分:0)

运行

hadoop jar parquet-tools-1.8.1.jar parquet.tools.Main dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text

答案 1 :(得分:0)

请使用以下内容:

hadoop jar parquet-tools-1.8.1.jar dump -c dir1 log1 job12121 -m / hdfs-path / to / parquet file with space.parquet>> /home/local/parquet/output.text

注意:输入参数没有单引号。