是否可以在Hadoop中将图像转换为Avro格式?
答案 0 :(得分:0)
Avro用于描述与平台无关的数据模式(A'数据序列化系统')。
图像本身可以以各种格式(PNG,JPEG,BMP,GIF等)进行编码,所有这些格式都可以表示为字节序列。您还可以另外定义一些关于图像的元数据(无论如何都可能以字节编码,但根据您的使用情况,提取它可能很有用。
原始模式可以如下(改编自docs):
{"namespace": "example.avro",
"type": "record",
"name": "Image",
"fields": [
{"name": "filename", "type": "string"},
{"name": "type", "type": "string"},
{"name": "data", "type": "bytes"},
{"name": "width", "type": "int"},
{"name": "height", "type": "int"}
]
}