如何根据numpy矩阵中的值和列计算特定行的均值?

时间:2018-11-15 01:23:38

标签: python numpy

我正在将文件加载到如下所示的pandas数据框中:

A    3    2    4    1
B    1    3    5    2
C    2    8    9    1
A    4    1    2    3

我将数据帧转换为numpy矩阵,因为我想将每个均值和方差存储在单独的26 x 4 numpy矩阵中,该矩阵将保存每个字母的每个特征的方差和均值。我的问题是如何找到特定字母和特定列的均值和方差?还有比从数据帧到矩阵更好的方法吗?或者这是解决问题的好方法吗?

我期望A的输出对于第1列为3.5,对于第2列为1.5,对于第3列为3,对于第4列为2。我将把它们每个附加到numpy矩阵。最终,我想生成的矩阵看起来像:

[[3.5, 1.5, 3, 2]
 [1, 3, 5, 2]
 [2, 8, 9, 1]]

因此,第一个数组是字母A列1-4的均值,下一个数组是字母B列1-4的均值,然后是字母C列1-4的均值。对于我的实际数据集,这将包括所有26个字母。

编辑:诚实的问题,为什么我为此投票?我用谷歌搜索了这个问题,找不到任何具体答案。

1 个答案:

答案 0 :(得分:0)

应该这样做,但是您需要指定列标题并将数据保留在数据框中。

 df[column_name].iloc[row_index].mean(axis=0)