标签: java hadoop mapreduce avro parquet
我们在MR工作中引入Parquet数据格式而不是Avro。
我们使用了AvroParquetInputFormat,它将LongWritable作为键,将GenericRecord作为值。但是我希望key作为GenericRecord,值可以是任何东西(无所谓)。