基于r中的唯一ID进行采样

时间:2015-01-16 03:47:14

标签: sampling subsampling

我有7500条消息,每条消息都有相应的唯一ID号。我将这些信息分成四季,并为季节提供了一系列信息:2013年冬季----> 2014年春季。 我想创建一个代表整个时期的1000条消息的样本,所以我将从5个季节中的每一个中收集200条消息。

我使用以下代码对唯一ID进行了采样:



s1    <-  sample(data$id[w13], size = 200, replace = FALSE)
s2   <-  sample(data$id[sp13], size = 200, replace = FALSE)
s3   <-  sample(data$id[su14], size = 200, replace = FALSE)
s4    <-  sample(data$id[a14], size = 200, replace = FALSE)
s5   <-  sample(data$id[w14], size = 200, replace = FALSE)
&#13;
&#13;
&#13; 然后我使用以下代码将这些附加到长度为1000的因子中:

&#13;
&#13;
id.sample    <-   unlist(list(s1,s2,s3,s4,s5))
&#13;
&#13;
&#13;

现在我想检索与这些ID相对应的消息。我使用以下代码,但这不起作用。

&#13;
&#13;
message.sample <-   data$text[data$id==id.sample]
&#13;
&#13;
&#13;

我做错了什么?

1 个答案:

答案 0 :(得分:0)

message.sample = data [data $ id%in%id.sample]使用此功能后,您将获得所有列。从那里你可以选择你想要的列。