格式化R上的两个样本t检验的数据

时间:2015-05-18 21:34:27

标签: r

假设我的数据集包含以下信息:

1)数量(例如购买的产品)

1 2 3

2)每个号码的频率(例如,购买该号码产品的人数)

2 5 10

假设我有两组中的每一组的上述信息:控制和测试数据。

如何格式化数据,使其如下所示:

controldata<-c(1,1,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3)

(每个数字*频率列为矢量)

testdata<- (similar to above)

这样我就可以在R?

上执行两个独立的样本t检验

如果我甚至不需要将它们作为矢量/如果有另一种聪明的方法来格式化数据以执行t检验,请告诉我!

如果向量像上面那样小,那将很简单,但我可以为每个数字设置> 10000的频率。

P.S。 控制和测试数据具有不同的样本量。

谢谢!

1 个答案:

答案 0 :(得分:0)

使用rep。使用上面的数据

rep(c(1, 2, 3), c(2, 5, 10))
# [1] 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3

或者,对于您的情况

control_data = rep(n_bought, frequency)