在R中:如何根据另一个较小的表中的gene_id从一个较大的表中获取行的子集

时间:2018-03-16 12:23:09

标签: r

我是R的新手,所以我可能会问一些对于高级R用户来说非常简单的事情。但是,如果可以,请帮助。感谢。

我有一个包含所有标准化计数(A)的较大表和一个包含DRG(B)的较小表。两个表的第一列是" Gene_ID"。我需要创建一个具有标准化计数的新表,该表将包含所有" Gene_ID"从较小的表(B)。

1 个答案:

答案 0 :(得分:0)

这是我的第一个答案。所以,如果我错了,请提前道歉。

您的问题似乎是表B和A的结合。

试试这个:

Subtable <- merge(x = TableB, 
               y = TableA[ ,c("Gene_ID", "Counts")], by = c("Gene_ID"), all.x = TRUE)
  

您可以按[,c("col1","col2")]指定两个表的列。

     

如果删除all.x,则会成为内部联接。

希望它有所帮助。

<强>更新

方法 - 2

试试这种方式,

library(dplyr)

df.c <- inner_join(table.b[ ,c("Gene_id","a2")],table.a[ ,c("Gene_id","X3")], by = "Gene_id")

将选择您在括号中指定的列名称。

此库中还有其他功能可以提供帮助。 试试:

如果你的req改变了,

left_join,right_join或outer_join就会起作用。