标签: java scala avro parquet
我想将一些Java / Scala对象存储为Parquet格式的记录,我目前正在使用parquet-avro和AvroParquetWriter类。这工作正常,但它非常适合Hadoop和它的文件系统实现。相反,我想以某种方式获取文件的原始二进制数据(最好,但不是绝对必要,以流方式)并处理“手动”文件的写入,因为我正在集成的框架的性质用。有没有人能够实现这样的目标?
AvroParquetWriter