我正在处理两个文件,分别为List File和一个Count Table。列表文件比计数表具有更多的序列(表示为序列ID号)。
我想删除列表文件中计数表中不存在的序列。
例如,制表符分隔的列表文件如下所示:
label numOtus Otu1 Otu2 Otu3 Otu4...
0.03 7647 1RDD4_02256_06492,1RDD4_02746_03372,1RDD4_04647_02715 VVP2U_04463_01357,VVP2U_01757_00241,VVP2U_02366_00662 1RDD4_03033_05153,VVP2U_04490_00688,VVP2U_00190_03758 VVP2U_00267_01898,1RDD4_01445_01883,1RDD4_01329_01451 VVP2U_01539_00744,VVP2U_00502_01639,VVP2U_00678_06956 VVP2U_01776_00793,VVP2U_01065_01146,VVP2U_04183_07213 VVP2U_01612_01003,1RDD4_04489_02389 VVP2U_02920_03779,VVP2U_02822_07567
以制表符分隔的计数表如下:
Representative_Sequence total o132 o137 o139 o143 o145 o146 o154 o155 o156 o212 o213 o216 o219 o220
VVP2U_04986_04053 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_00428_02444 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_01405_01516 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_00607_01976 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0