我有一个包含大约300k记录列的数据框,其中7k是唯一的。 我需要在桌子上进行繁重的操作,但记录的频率很重要 我的想法是在唯一的表格上执行操作,然后按重复术语的频率多次计算结果。
col<-(c('a','f','d','s','a','d','s','a'))
rep<-data.frame(col)
a<-as.data.frame(table(rep))
代表:
col
1 a
2 f
3 d
4 s
5 a
6 d
7 s
8 a
独特的价值观:
1 a
2 f
3 d
4 s
如果没有循环,有没有办法做到这一点?
对于这么多行,性能几乎是可怕的......你对此有什么消息吗?
谢谢,
米格尔