Question

我有一个大型数据集（38053行=成绩单，39列=样本）我想创建一个新数据集，其中包含特定成绩单组的所有样本值。

x= data1["698568366",]

适用于单个成绩单，其中“698568366”是成绩单的名称

但现在不是一次一个，我想使用3000次

我以为我应该可以使用：

data1[data1[,1] %in% 3000_m,]

其中3000_m是矩阵形式的列表，

但我一直在回来

  <0 Rows> (or row.names mit Length 0)

Answer 1

这是阵列a和b：

a = c(1:10)
b = c(11:20)

使用它们创建数据框：

df = data.frame(a, b)

这是我的索引作为数组：

ind = c(3, 5, 7)

选择索引为ind的行：

new_df = df[ind,]

你不能使用多维数组作为索引（据我所知）。

Answer 2

看起来您的成绩单名称实际上并未存储在数据框的第一列中，而是存储在行名称中。

如果是这种情况，并且您感兴趣的成绩单的名称存储在向量myTranscripts中，您可以使用：

x = data1[row.names(data1) %in% myTranscripts, ]