我通过烫印在HDFS上查看文件,在某些字段上聚合,并通过TSV写入制表符分隔文件。如何写出包含输出文件架构的文件?例如,
UnpackedAvroSource(args("input"))
.project('key, 'var1)
.groupBy('key){_.sum[Long]('var1 -> var1sum))}
.write(Tsv(args("output")))
我想写一个包含“Key,var1sum”的输出文本文件,以后有人拿起我的ooutput文件知道列是什么。我假设烫伤没有将其嵌入文件的某个地方?
感谢。
答案 0 :(得分:2)
刚刚找到了选项writeHeader = true,它会将列名写入输出文件,从而无需写入文件。