标签: java hadoop serialization hive orc
借助矢量化的行批处理,我能够成功地将任何CSV文件转换为ORC。但是根据新要求,我必须将任何类型的输入数据序列化为ORC格式。输入数据的数据类型是动态的。它可以是任何类型。我必须将输入数据(任何类型的数据,例如CSV,Avro等)序列化为字节数组,然后再将其写入ORC文件。我一直找不到任何可以满足此要求的东西。请阐明一些我应该如何采取的方法以及为实现这一目标而可以采取的一切措施。 org.apache.orc中是否对此有任何内置支持