假设我的数据集包含以下信息:
1)数量(例如购买的产品)
1 2 3
2)每个号码的频率(例如,购买该号码产品的人数)
2 5 10
假设我有两组中的每一组的上述信息:控制和测试数据。
如何格式化数据,使其如下所示:
controldata<-c(1,1,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3)
(每个数字*频率列为矢量)
testdata<- (similar to above)
这样我就可以在R?
上执行两个独立的样本t检验如果我甚至不需要将它们作为矢量/如果有另一种聪明的方法来格式化数据以执行t检验,请告诉我!
如果向量像上面那样小,那将很简单,但我可以为每个数字设置> 10000的频率。
P.S。 控制和测试数据具有不同的样本量。
谢谢!
答案 0 :(得分:0)
使用rep
。使用上面的数据
rep(c(1, 2, 3), c(2, 5, 10))
# [1] 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3
或者,对于您的情况
control_data = rep(n_bought, frequency)