yelp数据集在hive中解析json

时间:2016-08-01 03:32:59

标签: json hive yelp

create external table review
(
 business_id string,
 user_id string,
 stars Double,
 text string,
 date date,
 votes struct <
vote_type :string ,
count: int >)
ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe'

;

表已正确加载,但在尝试解析星号和日期字段时收到错误 在蜂巢上,即..来自评论的选择明星给出了错误。

使用的数据集来自以下链接,采用json格式 https://www.yelp.com/dataset_challenge

1 个答案:

答案 0 :(得分:0)

你应该给出LOCATION&#39; / user / ruchit31 / god /&#39;等指针。这样你的桌子就会指向那个位置。修改您的创建表查询

create external table review
 ( business_id string,
 user_id string,
 stars Double,
 text string,
 date date, 
votes struct < vote_type :string , count: int >
)
 ROW FORMAT SERDE 'com.cloudera.hive.serde.JSONSerDe'
LOCATION '/path/'