我的问题是关于如何最好地使用mapreduce并行化平均距离计算:下面显示了顺序过程的代码
list_distance = []
导入itertools
在itertools.combinations(data,2)中用于x,y的: list_distance.append(euclidean_distance(x,y))
print(list_distance)
总和= sum(list_distance)
mean_distance =(2.0 /(len(数据)*(len(数据)-1)))*求和
print(“总距离为” + str(求和)) print(“平均距离为” + str(mean_distance))