如何从元组列表计算相关性 - 每个元组都有对值

时间:2015-12-19 08:31:12

标签: python-3.x numpy scipy statistics correlation

我有一个元组列表,它们在Python中保存配对值,例如: [(0.2324,4),(0.8742,2),(0.11123,5)....] 我需要计算配对值与此列表的总相关性之间的相关性。 我知道Scipy和Numpy,但我没有找到任何功能来容纳我。

任何想法?

由于

1 个答案:

答案 0 :(得分:0)

Hej,

我遇到了同样的困难并最终做到了这一点:

from pyspark.mllib.stat import Statistics
x = result_rdd.map(lambda x: x[0])
y = result_rdd.map(lambda x: x[1])
Statistics.corr(x, y)

效率不高但是能胜任。