蜂巢-外部表的字符串值显示为NULL

时间:2019-06-03 10:11:11

标签: amazon-web-services amazon-s3 hive amazon-emr

我在S3存储桶中有JSON文件。文件结构应为

s3://bucket/myfiles/dt=2019060101/file1.JSON
s3://bucket/myfiles/dt=2019060101/file2.JSON
s3://bucket/myfiles/dt=2019060102/file1.JSON
s3://bucket/myfiles/dt=2019060102/file2.JSON

dt=yyyymmddHH

如果我在s3://bucket/myfiles/dt=2019060102/上创建一个外部表,则无法查看数据。

但是,如果我使用PARTITION (dt string)创建相同的表,则添加分区,它不起作用。

ALTER TABE my_tbl ADD PARTITION (dt='2019060101') location 's3://bucket/myfiles/dt=20190601/';

即使数据类型为字符串,也无法查看具有数值的数据。具有任何字符串值的所有列都显示NULL。

有人可以帮助解决此问题吗? 我正在使用EMR (v5.16) and hive 2.3.3

0 个答案:

没有答案