标签: join pyspark similarity approximate
我想根据它们的相似性加入两个巨大的数据框。我试过使用roximumlikenessjoin。但是,任务在一段时间后陷入困境,最终失败。
答案 0 :(得分:0)
有多种方法可以做到: