Avro架构从数据文件解析

时间:2016-09-30 04:39:02

标签: java avro

由于avro中的数据文件嵌入了该模式,因此读者不希望保留单独的.avsc文件来指定模式。我正在寻找一个以这种方式工作的java示例,我找不到。有人,请帮助我获取相同的代码示例。

Schema schema = new Schema.Parser().parse(new File("./AvroSchema/emp.avsc"));

DatumReader<GenericRecord> datumReader = new GenericDatumReader<GenericRecord>(schema);
DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("./AvroFileStore/empData.txt"), datumReader);

GenericRecord emp = null;
while (dataFileReader.hasNext()) {
    emp = dataFileReader.next(emp);
    System.out.println(emp);
}

在此示例中,我们使用DataFileReader将avro架构分别提供给datumReader

1 个答案:

答案 0 :(得分:1)

GenericDatumReader也有一个不带任何参数的构造函数。只是不要将任何架构传递给它。当然,这只适用于数据文件,而不适用于没有嵌入模式的数据流。

BTW构建dataFileReader后,您可以调用其getSchema()方法获取架构(如果需要)。

资料来源:Hadoop: The Definitive Guide by Tom White