我们可以在Hadoop中将图像转换为Avro格式吗?

时间:2013-01-07 13:52:08

标签: hadoop avro

是否可以在Hadoop中将图像转换为Avro格式?

1 个答案:

答案 0 :(得分:0)

Avro用于描述与平台无关的数据模式(A'数据序列化系统')。

图像本身可以以各种格式(PNG,JPEG,BMP,GIF等)进行编码,所有这些格式都可以表示为字节序列。您还可以另外定义一些关于图像的元数据(无论如何都可能以字节编码,但根据您的使用情况,提取它可能很有用。

原始模式可以如下(改编自docs):

{"namespace": "example.avro",
 "type": "record",
 "name": "Image",
 "fields": [
     {"name": "filename", "type": "string"},
     {"name": "type",  "type": "string"},
     {"name": "data", "type": "bytes"},
     {"name": "width", "type": "int"},
     {"name": "height", "type": "int"}
 ]
}