我正在使用以下
生成orc文件import org.apache.hadoop.io.Text;
import org.apache.hadoop.hive.ql.io.orc._;
val orcLine:OrcStruct = OrcUtils.createOrcStruct(
typeInfo,
new Text(value1),
new Text(value2),
new Text(value3),
new Text(value4),
new Text(value5));
但是,这里的挑战有时取决于某些条件,有时我可能有5个值(值1 ...值5),有时是10(值1 ...值10),有时有20(值1 ...值20)。
我怎样才能在这里带来这种动态行为?
如果值等于10,我应该拥有
val orcLine:OrcStruct = OrcUtils.createOrcStruct(
typeInfo,
new Text(value1),
new Text(value2),
new Text(value3),
new Text(value4),
new Text(value5),
new Text(value6),
new Text(value7),
new Text(value8),
new Text(value9),
new Text(value10));
有时我可能也有
val orcLine:OrcStruct = OrcUtils.createOrcStruct(
typeInfo,
new Text(value1),
new ShortWritable(Short.valueOf(value2)),
new LongWritable(Long.valueOf(value3)),
new DoubleWritable(Double.valueOf(value4)),
new FloatWritable(Float.valueOf(value5)));
我当前正在使用Scala 2.11版。
非常感谢您的帮助!
答案 0 :(得分:2)
假设您的参数存储在列表中:
val params = List(
new Text(value1),
new ShortWritable(Short.valueOf(value2)),
new LongWritable(Long.valueOf(value3)),
new DoubleWritable(Double.valueOf(value4)),
new FloatWritable(Float.valueOf(value5)))
)
您可能已经注意到OrcUtils.createOrcStruct将可变的对象列表作为第二个参数。
为了在scala中将列表作为varargs传递,您需要使用:_*
。在方法调用期间,它会以varargs的形式“扩展” 您的列表:
OrcUtils.createOrcStruct(typeInfo, params:_*)