标签: python pyspark
我有一个商业ID的rdd
rdd => ['business_id1', 'business_id2', 'business_id3']
如何在python中以分布式方式在spark中使用Itertools创建所有业务ID对的组合