我有一个像这样的大数据框(简化):
文件1:
1 ID Apo1 Apo2 description Symbol
2 12 0.983 0.675 proteinA AAG
3 34 0.876 0.123 ProteinB BEH
4 54 0.432 0.445 proteinC CFD
5 65 0.544 0.103 ProteinD DDS
现在我想要对这个文件进行排序,并且只包含某些包含某些"符号的行"在"符号列中(在本例中为第4列)
我想要的符号在文件2(简化)
文件2:
AAG
CFD
DDS
所以我想得到一个看起来像这样的新文件,所以只包含文件1的行,这些行链接到符号列中文件2的符号:
新文件:
1 ID Apo1 Apo2 description Symbol
2 12 0.983 0.675 proteinA AAG
4 54 0.432 0.445 proteinC CFD
5 65 0.544 0.103 ProteinD DDS