我有很少的文件存储在HDFS中以镶木地板格式存储,我正在尝试在hive中创建一个新的外部表,假设它指向那些数据文件。
所以,我使用 -
在hive中创建了一个表CREATE EXTERNAL TABLE ORDERS_P (
ORDERID INT,
ORDER_DATE BIGINT,
CUSTOMER_ID INT,
STATUS STRING)
STORED AS PARQUET
LOCATION 'hdfs:///user/cloudera/retail/parquet/orders';
创建表但是当我在hive中的表上运行查询时 -
SELECT * FROM ORDERS_P LIMIT 10
它返回除ORDER_DATE列之外的所有NULL值 -
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
NULL 1402729200000 NULL NULL
我使用spark-shell验证了那些文件中是否存在数据。不确定我做错了什么。任何帮助赞赏。