data.table使用t.test比较组

时间:2017-07-01 05:31:21

标签: r data.table t-test

我有以下数据结构。

textview2

我想做的是在由var1分组的gp1和gp2之间执行t.test。当只有一列数据使用类似的内容时,我已阅读了其他一些帖子:

dat <- as.data.table(cbind(var1=rep(1:5, 200), 
var2=rep(c("gp1", "gp2"), each=500), 
as.data.frame(matrix(rnorm(5000, 0, 1),ncol=5))))

我能为我的生活找到的是我如何在所有其他专栏(即V2到V5)上做到这一点。小插图有助于指出使用lapply(.SD,某些函数)迭代列,但在这种情况下,我不太确定如何为我工作。

上面的示例是一个玩具示例,我实际上处理了数百万行数据和数百列,因此速度是一个问题。我目前正在使用嵌套的应用来遍历行和列,该函数需要数小时才能运行。我希望能有更快的东西。

如果我能在两个不同的data.tables之间做到这一点会更好。 (即gp1在其自己的data.table中,而gp2在另一个中)。

对于data.table来说,R,noob的长期用户。

任何想法都会非常有用。

谢谢, 肯

0 个答案:

没有答案