我是Hive的新手,得到一些东西来解析格式
的日志[Time Stamp] {Complex JSON data}
从目前为止我的搜索中看到,有JSON Serde可用。
我可以扩展那些JSON Serde代码以满足我的需要吗?如果是这样,哪个JSON serde代码会更好选择?
如果这种方法不好,还有其他指针吗?
由于
答案 0 :(得分:0)
而不是使用任何其他开源serde,
我发现自己写一个serde要简单得多。除了锅炉板代码之外,我只需要在反序列化方法中编写我的业务逻辑,这就像一个魅力。
此链接非常有用。 http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/
另外,我尝试使用UDTF,它也很顺利,发现serde更快。
希望这有助于某人