如何在将带有hdfs的orc文件复制到该表的文件夹后更新配置单元表的数据

时间:2017-01-10 08:40:56

标签: hive hdfs orc

将orc文件插入带有hdfs副本的表的文件夹后,如何更新该hive表的数据,以便在使用hive查询时查看这些数据。

最诚挚的问候。

2 个答案:

答案 0 :(得分:1)

如果表未分区,则一旦文件位于LOCATION子句中指定的文件夹中的HDFS中,则数据应可用于查询。
如果表是分区的,那么首先需要运行ADD PARTITION语句。

答案 1 :(得分:0)

如belostoky在较高答案中所述。如果表未分区,则可以直接使用更新的数据查询表 但是,如果您的表已分区,则需要在配置单元表中首先添加分区,您可以使用

您可以使用alter table语句添加如下所示的分区

ALTER TABLE table1
    ADD PARTITION (dt='<date>')
    location '<hdfs file path>'

一旦添加分区,hive metastore应该知道更改,因此您需要运行

msck repair table table1 

在metastore中添加分区。

完成后,您可以查询数据