我在GNU并行环境中运行了一个软件。我有2500个不同的目录,每个目录包含一个名为results_table.txt的输出文件。完成运行后,我了解该软件的内置脚本无法正常运行的原因(以前它在另一列中提供了序列标识符,可用来跟踪结果)。result_table.txt文件如下所示:
Resistance gene Identity Query/HSP Contig Position in contig Phenotype Accession no.
aac(3)-Ib-aac(6')-Ib 100.00 1005/1005 aac(3)-Ib-aac(6')-Ib_1_AF355189 1..1005 Aminoglycoside resistance AF355189
aph(4)-Ia 100.00 1026/1026 aph(4)-Ia_1_V01499 1..1026 Aminoglycoside resistance V01499
grmA 100.00 1270/1270 grmA_1_M55520 1..1270 M55520
ant(3'')-Ih-aac(6')-IId 100.00 1392/1392 ant(3'')-Ih-aac(6')-IId_1_AF453998 1..1392 Aminoglycoside resistance AF453998
aac(6')-aph(2'') 100.00 1440/1440 aac(6')-aph(2'')_1_M13771 1..1440 Aminoglycoside resistance M13771
aac(6')-aph(2'') 100.00 1455/1455 aac(6')-aph(2'')_1_KF652095 1..1455 Aminoglycoside resistance KF652095
aacA29 100.00 381/381 aacA29_1_AY139599 1..381 Aminoglycoside resistance AY139599
aac(6') 100.00 402/402 aac(6')_2_DQ302723 1..402 Aminoglycoside resistance DQ302723
aac(6')-Iad 100.00 435/435 aac(6')-Iad_1_AB119105 1..435 Aminoglycoside resistance AB119105
现在,如果我至少可以在相应的result_table.txt的每一行中粘贴目录名称,那么它也可以达到我的目的。我无法在每行中粘贴文件名。我用awk尝试了2500个目录中的一个目录。
cut -f1,6 ~/PA_refseq91/GCF_000152545.1_ASM15254v1_genomic/results_tab.txt | awk '{print $1 "\t" $2 "\t" FILENAME }'
我想让一个.txt文件看起来像
Resistance gene Phenotype Genome
aac(3)-Ib-aac(6')-Ib Aminoglycoside resistance GCF_000152545.1
如何生成它?
欢呼声