Question

我基本上是在寻找与R中以下python代码等效的代码：

df.groupby('Categorical')['Count'].count()[0]

以下是我在R中所做的事情：

by(df$count,df$Categorical,sum)

这完成了与第一个代码相同的操作，但是我想知道如何将索引值存储到R中的变量（R的新手）。

Answer 1

基于by代码，看来我们可以使用（假设“ count”为1s的列）

library(dplyr)
out <- df %>%
        group_by(Categorical) %>%
        summarise(Sum = sum(count))

如果“计数”列也具有其他值，则python函数将对“分类”列进行频率计数。因此，类似的选择是

out <- df %>% 
        count(Categorical) %>%
        slice(1) %>%
        pull(n)