我已经使用df %>%
mutate(y = group_indices(., x))
和numpy
很长时间了,但通常还是对沿轴进行操作的概念感到困惑。
例如,如果我有一个形状为[200,5]的数据,并且想查找结果为形状[1,5]的均值,则我将首先调用pandas
,如果没有没有用,我会尝试data.mean(axis=0)
。
结果是,在这种情况下data.mean(axis=1)
是正确的。但是我没有很好的术语来记住要使用哪个轴。
当前,我认为无论我要将形状减小为1的任何轴,都需要在该轴上应用该操作。
对于axis=0
,mean
或sum
之类的归约运算来说,这很好。
但是我不知道如何思考何时应用不减小形状的操作,例如std
,divide
,add
等(对于{{ 1}}和sort
的形状不同,涉及广播)
因此,我感到好奇的是创建divide
和add
的人对此有何直觉。当他们说“沿行轴排序”时,它们的确切含义使我感到好奇。
我想很清楚地理解它,以至于我知道在调用某个轴时会得到什么结果!