我有一个大型数据集(38053行=成绩单,39列=样本) 我想创建一个新数据集,其中包含特定成绩单组的所有样本值。
x= data1["698568366",]
适用于单个成绩单,其中“698568366”是成绩单的名称
但现在不是一次一个,我想使用3000次
我以为我应该可以使用:
data1[data1[,1] %in% 3000_m,]
其中3000_m是矩阵形式的列表,
但我一直在回来
<0 Rows> (or row.names mit Length 0)
答案 0 :(得分:0)
这是阵列a和b:
a = c(1:10)
b = c(11:20)
使用它们创建数据框:
df = data.frame(a, b)
这是我的索引作为数组:
ind = c(3, 5, 7)
选择索引为ind的行:
new_df = df[ind,]
你不能使用多维数组作为索引(据我所知)。
答案 1 :(得分:0)
看起来您的成绩单名称实际上并未存储在数据框的第一列中,而是存储在行名称中。
如果是这种情况,并且您感兴趣的成绩单的名称存储在向量myTranscripts
中,您可以使用:
x = data1[row.names(data1) %in% myTranscripts, ]