我使用hadoop java api在mapreduce作业之外创建一个ORCFile。 ORCFiles的Writer类有一个方法addRow(Object row)。我的问题是我应该使用什么类型的"行"参数,如果我想能够使用配置单元查询此文件?
https://hive.apache.org/javadocs/r0.12.0/api/org/apache/hadoop/hive/ql/io/orc/Writer.html
答案 0 :(得分:0)
在java中创建ORC文件主要是编写大量样板代码的问题。如果你看看apache-orc测试文件,你就可以很好地了解如何操作。我刚刚发布了一个开源库,它使用运行时代码生成来处理所有样板,并使得将java对象序列化为ORC变得微不足道。该库可通过github获取。该库被称为eclectic-orc。