我有一个元组列表,它们在Python中保存配对值,例如: [(0.2324,4),(0.8742,2),(0.11123,5)....] 我需要计算配对值与此列表的总相关性之间的相关性。 我知道Scipy和Numpy,但我没有找到任何功能来容纳我。
任何想法?
由于
答案 0 :(得分:0)
Hej,
我遇到了同样的困难并最终做到了这一点:
from pyspark.mllib.stat import Statistics
x = result_rdd.map(lambda x: x[0])
y = result_rdd.map(lambda x: x[1])
Statistics.corr(x, y)
效率不高但是能胜任。