标签: serialization hadoop protocol-buffers avro
我是Hadoop世界的新手。我知道Hadoop有自己的序列化机制,叫做Writables。那个AVRO是另一个这样的库。我想知道我们是否可以使用Google的协议缓冲区序列化编写map-reduce作业?如果是,那么有些人可以指出一个很好的例子让我开始。
答案 0 :(得分:4)
Twitter发布了他们的elephant-bird库,允许hadoop使用协议缓冲文件。