我正在将文件加载到如下所示的pandas数据框中:
A 3 2 4 1
B 1 3 5 2
C 2 8 9 1
A 4 1 2 3
我将数据帧转换为numpy矩阵,因为我想将每个均值和方差存储在单独的26 x 4 numpy矩阵中,该矩阵将保存每个字母的每个特征的方差和均值。我的问题是如何找到特定字母和特定列的均值和方差?还有比从数据帧到矩阵更好的方法吗?或者这是解决问题的好方法吗?
我期望A的输出对于第1列为3.5,对于第2列为1.5,对于第3列为3,对于第4列为2。我将把它们每个附加到numpy矩阵。最终,我想生成的矩阵看起来像:
[[3.5, 1.5, 3, 2]
[1, 3, 5, 2]
[2, 8, 9, 1]]
因此,第一个数组是字母A列1-4的均值,下一个数组是字母B列1-4的均值,然后是字母C列1-4的均值。对于我的实际数据集,这将包括所有26个字母。
编辑:诚实的问题,为什么我为此投票?我用谷歌搜索了这个问题,找不到任何具体答案。
答案 0 :(得分:0)
应该这样做,但是您需要指定列标题并将数据保留在数据框中。
df[column_name].iloc[row_index].mean(axis=0)