PySpark:使用从另一个数据框中随机选择的主键创建一个列

时间:2019-03-26 19:33:24

标签: apache-spark pyspark apache-spark-sql

我有两个数据框A和B。

A有一个主键key_a。

我想在B上创建一列外键,以从a中选择一个随机键。

所以B看起来像

key_b | key_a
1     | 1234123
2     | 5424352

等...

键可以重复,但是目标是为B的每一行分配A的key_a列中的随机值。

0 个答案:

没有答案