作为镶木地板文件的外部配置单元表在查询时返回NULL

时间:2016-02-27 03:29:43

标签: hadoop hive hdfs parquet

我使用map reduce job创建了一个.parquet文件。现在我想在这个文件的顶部创建一个外部表。这是命令:

CREATE EXTERNAL TABLE testparquet (
  NAME STRING, 
  AGE INT
)
STORED AS PARQUET 
LOCATION 'file location'

表已成功创建,但是当我使用简单SELECT *查询表时,我将所有字段的数据都设为NULL。蜂巢的版本是0.13。

我有什么遗失的吗?

1 个答案:

答案 0 :(得分:0)

使用external文件时,您需要将了解数据架构的元数据存储与实际数据本身明确同步。

通常,您将使用INVALIDATE METADATA命令强制执行以下查询以重新读取数据。如果您只有一个已更新的表,也可以使用REFRESH <table-name>