如何在.orc文件中读取表格配置单元?

时间:2018-05-16 07:35:12

标签: hadoop hive orc

我有一个.orc文件,有没有办法将其转换为.csv文件?或者是否有另一种方法来读取此文件中的表格?

1 个答案:

答案 0 :(得分:0)

Hive具有原生ORC支持,因此您可以通过Hive直接阅读。

<强>插图:

(比如,文件名为myfile.orc

将文件上传到HDFS

hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file

在其上创建一个Hive表

(更新列定义以匹配数据)

CREATE EXTERNAL TABLE `my_table_orc`(
  `col1` string,
  `col2` string)
STORED AS ORC
LOCATION
  'hdfs:///my_table_orc_file';

查询

select * from my_table_orc;