Python Apache Beam - 当一个集合的键是其他集合键的子键时,加入两个Pcollections

时间:2017-10-31 16:19:22

标签: python apache-beam

我有这样的情况:

我的第一个Pcollection的形式是:

(ID1): (status)

我的第二个集合的格式为:

(ID1, ID2): (score1, score2)

我需要加入他们才能拥有

(ID1, ID2): (score1, score2, status)

即。我希望独立于ID1 ID2加入他们。我该怎么做?我应该将我的第二个集合改写为

(ID1): (ID2, score1, score2)

首先然后用CoGroupByKey()加入它们?如果是这样,我如何重新设置键/值,以便将键的一部分移动到值?

提前致谢

0 个答案:

没有答案