烫毛:从管道操作输出模式

时间:2014-12-15 18:04:57

标签: scala hadoop scalding

我通过烫印在HDFS上查看文件,在某些字段上聚合,并通过TSV写入制表符分隔文件。如何写出包含输出文件架构的文件?例如,

UnpackedAvroSource(args("input"))
  .project('key, 'var1)
  .groupBy('key){_.sum[Long]('var1 -> var1sum))}
  .write(Tsv(args("output")))

我想写一个包含“Key,var1sum”的输出文本文件,以后有人拿起我的ooutput文件知道列是什么。我假设烫伤没有将其嵌入文件的某个地方?

感谢。

1 个答案:

答案 0 :(得分:2)

刚刚找到了选项writeHeader = true,它会将列名写入输出文件,从而无需写入文件。