我是Protobuf和Hive的新手。我试图在Hive中存储protobufs,并且似乎在我的protobuf中遇到了新行的问题。我看到用户Griffin已经成功地做到了这一点。
Custom inputformat to process protobufs in hadoop 0.20
你能告诉我更多有关这方面的细节吗?我曾尝试使用ElephantBird和Hive-protobuf,它们都使用了Sequencefiles,而且我的序列文件格式没有我的protobuf。
答案 0 :(得分:1)
Hive-protobuf
确实为我处理了这种情况。没有其他选项,我必须将protobufs
转换为Sequencefiles
,现在我可以使用Hive SerDe
。