我的数据包含三列。第一列是一个包含大约70,000个项目的因子,其中4,500个是唯一的。第二列是日期,最后一列是一个月执行因子的所有时间的计数。
我想按唯一因素对数据进行分组。在R中有一个简单的方法吗?截至目前,我一直在python中编写一个脚本,用于识别独特因素并使用groupby。我觉得R可能有一些东西可以做到这一点,但我只是没有意识到它。有任何想法吗?
答案 0 :(得分:0)
不确定问题或数据集的具体细节。但是我发现dplyr是为了这个去R包。
我还建议您查看DataCamp中的资源。他们为R
提供了良好的互动课程以下是一些可能有用的dplyr函数
group_by() # the factor
select() # variables you want to summarize
summarize() # summarize selected variables