我基本上是在寻找与R中以下python代码等效的代码:
df.groupby('Categorical')['Count'].count()[0]
以下是我在R中所做的事情:
by(df$count,df$Categorical,sum)
这完成了与第一个代码相同的操作,但是我想知道如何将索引值存储到R中的变量(R的新手)。
答案 0 :(得分:1)
基于by
代码,看来我们可以使用(假设“ count”为1s的列)
library(dplyr)
out <- df %>%
group_by(Categorical) %>%
summarise(Sum = sum(count))
如果“计数”列也具有其他值,则python
函数将对“分类”列进行频率计数。因此,类似的选择是
out <- df %>%
count(Categorical) %>%
slice(1) %>%
pull(n)