在Hadoop Cascading Flow中,我有许多元组被处理,最后我沉入目的地。
现在我的要求是:在目标文件中使用某些已定义的常量字符串值在开头和结尾处接收该元组。
例如:我有以下输入元组
10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10
现在我需要这样的输出:
Certain data before those data
10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10
Certain data after those data
有点我搜索了存储库类 DelimitedParser 及其方法,如 joinLine , joinFirstLine ,但由于文档不佳,我无法获取确切的一点。
答案 0 :(得分:0)
可能取决于“那些数据之前的某些数据”是什么意思? 如果您使用TextDelimited,则可以将标头值转储到接收器中。默认情况下,不会根据文档编写标题值,因此您需要启用它。另一件需要记住的事情是标题值代表输出字段。
-Amit