我的本地计算机上有一个ORC文件,并且需要任何合理的格式(例如CSV,JSON,YAML等)。
如何将ORC转换为CSV?
答案 0 :(得分:0)
java
文件夹并执行maven:mvn install
这是我的使用方式-您可能需要调整路径:
java -jar ~/.m2/repository/org/apache/orc/orc-tools/1.5.4/orc-tools-1.5.4-uber.jar data ~/your_file.orc > output.json
输出为JSON Lines,易于转换为CSV。首先,我需要从输出中删除最后两行。然后:
import pandas as pd
df = pd.read_json('output.json', lines=True)
df.to_csv('output.csv')
答案 1 :(得分:0)
另一个选项可能是 bigdata-file-viewer,它是一个跨平台的应用程序。您可以打开 ORC 文件并以 CSV 格式保存该文件。
详细用法如下: