我正在尝试理解python axis
中的pandas
参数。我知道它类似于numpy轴,但下面的例子仍然让我困惑:
a = pd.DataFrame([[0, 1, 4], [1, 2, 3]])
print a
0 1 2
0 0 1 4
1 1 2 3
根据this post,axis=0
沿着行(固定列)运行,而axis=1
沿着列(固定行)运行。运行print a.drop(1, axis=1)
会产生
0 2
0 0 4
1 1 3
会导致删除列,而print a.drop(1, axis=0)
会删除一行。为什么?这对我来说似乎是倒退。
答案 0 :(得分:4)
这有点令人困惑,但axis=0
对行进行操作,axis=1
对列进行操作。
因此,当您使用df.drop(1, axis=1)
时,您要说删除第1列。
另一篇帖子有df.mean(axis=1)
,基本上是计算每行的平均值。
这类似于索引numpy数组,其中第一个索引指定行号(第0维),第二个索引指定列号(第一维),依此类推。