我正在使用Python,我想在Apache beam中的多个列上实现groupBy。例如,我有一个包含3列的以下数据集:
GM TV 7500.2 abc
在线2000.1 def
CONSOLE 1000.2 ghi
控制台6500.6 ghi
GM TV 4500.5 abc
CONSOLE 9500.4 ghi
如何根据第一列和第三列对数据进行分组?
答案 0 :(得分:1)
您可以使用元组(column 1, column 3)
作为GBK转换中的关键字。