如何在级联中仅从一行中获取某些列

时间:2016-06-08 21:24:52

标签: java hadoop cascading

假设我有一个带有这样的元组的管道:

[K1, V1, V2, V3]

其中每个都由制表符分隔。并且假设我只想提取第一列和第二列(V2列)。我如何使用每个管道实现这一目标?

[K1, V1, V2, V3]  -> Each pipe -> [K1, V2]

2 个答案:

答案 0 :(得分:1)

您可以使用Retain管道并传递您要保留的字段。

您的示例看起来像

[K1, V1, V2, V3]  -> Retain pipe -> [K1, V2]

答案 1 :(得分:0)

pipe = new每个(管道,新字段(“K1”,“V2”),新标识(),Fields.RESULTS);