我有一个超过40k行的数据帧。此数据集包含2列AccountNumber
和NumberOfContacts
。我使用以下代码创建了直方图:
p <- ggplot() + aes(contactsInfo$NumberOfContacts) + geom_histogram(binwidth=10) + xlim(10,300)+
xlab("Number of contacts") + ylab("Number of accounts")
p
我现在想根据容器创建一个名为'Bin'的附加列到我的原始数据帧。
例如:
如果AccountNumber
在0-10个联系人中,则Bin
列AccountNumber
应该等于1。
同样,如果AccountNumber
有50-60个联系人,那么Bin
应该等于5,依此类推......
我可以想到一个荒谬的ifelse
声明组合,这对于完成这项任务非常漫长。我希望是否有更简单的方法来实现这一点。
非常感谢任何帮助。
答案 0 :(得分:3)
我不知道您的数据集的所有细节,但在mutate
包中使用dplyr
:
mutate(contactsInfo, bin = floor(NumberOfContacts / 10))
答案 1 :(得分:0)
您可以使用类似
的内容process.StartInfo.CreateNoWindow = true;