用Hive反序列化protobuf列

时间:2016-11-07 01:30:28

标签: hadoop hive protocol-buffers hive-serde

我对Hive真的很新,如果我的问题有任何误解,我道歉。

我需要将hadoop序列文件读入Hive表,序列文件是thrift二进制数据,可以使用Hive附带的SerDe2对其进行反序列化。

现在的问题是:文件中的一列是用Google protobuf编码的,所以当thrift SerDe处理序列文件时,它不会正确处理protobuf编码列。

我想知道Hive是否有办法处理嵌套在thrift序列文件中的这种protobuf编码列,以便可以正确解析每列?

非常感谢您提供任何可能的帮助!

1 个答案:

答案 0 :(得分:0)

我相信你应该使用其他一些serde来反序列化proto buff格式,

可能是你可以参考,

https://github.com/twitter/elephant-bird/wiki/How-to-use-Elephant-Bird-with-Hive