标签: apache-spark pyspark apache-spark-sql
我有两个数据框A和B。
A有一个主键key_a。
我想在B上创建一列外键,以从a中选择一个随机键。
所以B看起来像
key_b | key_a 1 | 1234123 2 | 5424352
等...
键可以重复,但是目标是为B的每一行分配A的key_a列中的随机值。