如何使用第2列作为数据集中重复第1列值的次数?

时间:2016-09-13 21:36:33

标签: r statistics

好的,这是我第一次使用R(我使用Linux,在朋友的建议下下载了R指挥官)。我需要对数据集进行分析,但我的问题是我只有两列,第一列我的样本中有某个元素的百分比,而第二列我有我做的观察量提出了所述%,如:

% Number of Observations 

35 1 

36 1 

37 9 

38 16 

39 29 

40 58 

41 97 

42 149 

43 270 

44 466

我需要在R上分析这个数据集,但是我似乎只能在一个列中为每个观察实际上将数据放在不同的行中。我似乎无法找到如何对程序说第一列中的每个值重复X次(X是第二列中的值),这就是我想要的。

在60%左右,我得到了大约400,000次观察,因为我发现60%的观察总数为400.000次......

在这种情况下如何使用R?告诉程序,第1列中的值Y重复X次,X是第2列中的值?

谢谢,对不起,如果这是一个愚蠢的问题......

编辑:已经尝试使用某人在另一个网站上发送给我的代码,以便对每个观察进行多次观察,如下所示:

dat <- data.frame(my_values = c(35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94),
num_of_times = c(1, 1, 9, 16, 29, 58, 97, 149, 270, 466, 744, 1091, 1585, 2341, 3443, 5102, 7673, 12197, 20871, 41056, 84392, 133921, 173733, 214256, 257429, 300452, 342381, 381279, 412322, 433175, 439427, 428765, 403470, 365109, 316814, 266461, 218282, 173419, 133612, 100321, 73180, 51879, 35188, 22830, 14523, 9061, 5498, 3309, 2011, 1115, 561, 311, 168, 67, 23, 10, 3, 1, 1, 1))
data_with_rep <- rep(dat$my_values, dat$num_of_times)
data_with_rep

我在R(Linux终端,而不是Rcmdr)中得到的是:

[ reached getOption("max.print") -- omitted 5795960 entries ]

0 个答案:

没有答案