我使用map reduce job创建了一个.parquet
文件。现在我想在这个文件的顶部创建一个外部表。这是命令:
CREATE EXTERNAL TABLE testparquet (
NAME STRING,
AGE INT
)
STORED AS PARQUET
LOCATION 'file location'
表已成功创建,但是当我使用简单SELECT *
查询表时,我将所有字段的数据都设为NULL。蜂巢的版本是0.13。
我有什么遗失的吗?
答案 0 :(得分:0)
使用external
文件时,您需要将了解数据架构的元数据存储与实际数据本身明确同步。
通常,您将使用INVALIDATE METADATA
命令强制执行以下查询以重新读取数据。如果您只有一个已更新的表,也可以使用REFRESH <table-name>
。