GUI或CLI创建镶木地板文件

时间:2019-08-19 15:45:45

标签: user-interface command-line-interface parquet

我想提供一个与我一起工作的人的工具,该工具可以创建实木复合地板文件,以用于读取和处理此类文件的模块的单元测试。

我使用ParquetViewer来查看镶木地板文件的内容,但是我喜欢有一个制作(样本)镶木地板文件的工具。是否有这样的工具可以使用GUI或一些实用的CLI创建镶木地板文件?

注意:我更喜欢跨平台的解决方案,但如果没有,我正在寻找Windows / mingw解决方案以便在工作中使用它-我无法选择操作系统:\

1 个答案:

答案 0 :(得分:1)

用Java编写的

parquet-cli可以从CSV转换为镶木地板。

(这是Windows上的示例)

test.csv在下面:

emp_id,dept_id,name,created_at,updated_at
1,1,"test1","2019-02-17 10:00:00","2019-02-17 12:00:00"
2,2,"test2","2019-02-17 10:00:00","2019-02-17 12:00:00"

在Windows上需要winutils。下载并设置环境值。

$ set HADOOP_HOME=D:\development\hadoop

克隆parquet-mr,构建所有文件并运行parquet-cli的'convert-csv'命令。

$ cd parquet-cli
$ java -cp target/classes;target/dependency/* org.apache.parquet.cli.Main convert-csv C:\Users\foo\Downloads\test.csv -o C:\Users\foo\Downloads\test-csv.parquet

'cat'命令显示该实木复合地板文件的内容。

$ java -cp target/classes;target/dependency/* org.apache.parquet.cli.Main cat C:\Users\foo\Downloads\test-csv.parquet
{"emp_id": 1, "dept_id": 1, "name": "test1", "created_at": "2019-02-17 10:00:00", "updated_at": "2019-02-17 12:00:00"}
{"emp_id": 2, "dept_id": 2, "name": "test2", "created_at": "2019-02-17 10:00:00", "updated_at": "2019-02-17 12:00:00"}