标签: python scala http apache-spark
我正在努力实现以下两个目标。
a。每个分区以一个API的形式调用多个HTTP api
b。将所有分区的结果合并到一个数据帧中并保留顺序。
根据我的研究,我可以执行以下步骤:
mapPartitions
这是正确的方法吗?还有如何确保数据到达 在合并之前在每个分区中。