在Apache Beam转换中对CSV列进行分组

时间:2018-08-22 18:46:16

标签: apache-beam

我有一个约200列的csv。我想对每列进行分组,以便获得col_name:[column]对作为元素的集合。使用Beam python sdk怎么做?

1 个答案:

答案 0 :(得分:0)

您可以输出(column_index,column_value)的元组,然后可以按列索引对其进行分组。如果您具有与各列关联的名称,则可以输出(column_name,column_value)。

参考:https://beam.apache.org/documentation/programming-guide/#core-beam-transforms