R帮助 - 创建子数据集

时间:2015-10-22 14:38:47

标签: r subset

我有一个大型数据集(38053行=成绩单,39列=样本) 我想创建一个新数据集,其中包含特定成绩单组的所有样本值。

x= data1["698568366",]

适用于单个成绩单,其中“698568366”是成绩单的名称

但现在不是一次一个,我想使用3000次

我以为我应该可以使用:

data1[data1[,1] %in% 3000_m,]

其中3000_m是矩阵形式的列表,

但我一直在回来

  <0 Rows> (or row.names mit Length 0)

2 个答案:

答案 0 :(得分:0)

这是阵列a和b:

a = c(1:10)
b = c(11:20)

使用它们创建数据框:

df = data.frame(a, b)

这是我的索引作为数组:

ind = c(3, 5, 7)

选择索引为ind的行:

new_df = df[ind,]

你不能使用多维数组作为索引(据我所知)。

答案 1 :(得分:0)

看起来您的成绩单名称实际上并未存储在数据框的第一列中,而是存储在行名称中。

如果是这种情况,并且您感兴趣的成绩单的名称存储在向量myTranscripts中,您可以使用:

x = data1[row.names(data1) %in% myTranscripts, ]