从Serde中的现有表字符串字段中摄取

时间:2017-11-22 01:39:27

标签: hive hive-serde

我正在寻找使用Serde解析HIVE中的json字符串,但是从HIVE表中已有的字符串看不到这么简单。你知道我怎么做吗?

为了让我的场景更容易理解,这里有一个我可以尝试的屠宰示例:

ADD JAR hdfs:////user/d/libs/json-serde-1.3.8-jar-with-dependencies.jar;

CREATE Temporary TABLE TN (v string);
Insert overwrite table TN select '
[
    {"t1":31646203,"t2":"h","s1":
       [
         {"r1":"w","r2":"w2"}
       ]
     }
]' as v;

CREATE TABLE deserializeThis (jsonDeserialized array<struct<t1:int,t2:string,s1:array<struct<r1:string, r2:string>>>>)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe';

Insert overwrite table deserializeThis select v FROM TN;

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

为了使用SerDe,我们可以在文件系统级别上运行。为此,我们可以将信息推送到表中,并使用SerDe从该位置读取。

这个答案描述了以上内容: How can I parse a Json column of a Hive table using a Json serde?