Question

好，所以我有两个看起来像下面的DataFrame。第一个称为load，第二个称为lmp。

   read_date  hour_ending  reading
0 2016-02-12            1   6.3634
1 2016-02-12            2   6.3418
2 2016-02-12            3   6.3893
3 2016-02-12            4   6.3115
4 2016-02-12            5   6.6118

和

   read_date  hour_ending    reading
0 2016-02-12            1  30.428136
1 2016-02-12            2  29.709692
2 2016-02-12            3  29.474148
3 2016-02-12            4  29.456977
4 2016-02-12            5  29.574211

我想要的是使用reading中的第一个值将两个DataFrames中的pearsonr列中的每个值与我认为应类似于以下{{1} }。

Answer 1

合并或合并您的数据框。或只是简单地用两列要计算相关性的对应值。

样本：

df = pd.merge(load, lmp, on=['read_date','hour_ending'])

使用inate pandas.dataframe相关函数来计算所需列的相关性：

df[['reading_x','reading_y']].corr() ## notice that the columns get automatically renamed on pd.merge() since they had the same name

请注意，两个系列的长度都应相同

如果使用合并，如果没有唯一的密钥要合并，则可能会遇到问题

您可以将两个系列都传递给numpy.corrcoef函数

如何获得每个月具有皮尔逊相关系数的DataFrame？

1 个答案: