我写了一个python脚本(在我朋友的大力帮助下),该脚本允许我执行以下操作:
1. Search multiple directories for files with the identical names
2. Append the absolute path to the name of the file
3. Add all the files to one directory
这样做是为了避免使用cp命令时文件被覆盖。
最近我尝试使用该脚本,但是现在出现这样的错误:
代码:python ~/gatherfiles.py —outdir protein_files —trgfile ./*/protein.faa
错误:
gatherfiles.py: error: unrecognized arguments: ./GCF_000374525.1_ASM37452v1_genomic.fna_dfast/protein.faa ./GCF_000463742_ASM94337v1_genomic.fna_dfast/protein.faa ./GCF_...etc.
有人知道如何克服这个问题吗?
这是实际的脚本:
_all__ = ['gatherfiles']
import os
import glob
import shutil
import argparse
def gatherfiles(outdirpath, trgfilename):
"""
Args:
- outdirpath (str): A path to output directory.
- trgfilename (str): A name of target file. Escape sequence is available (eg. '*.txt').
"""
# make output dir
os.makedirs(outdirpath, exist_ok=True)
# search target file
paths = glob.glob(trgfilename, recursive=True)
for path in paths:
dname = os.path.dirname(path).split('/')[-1]
fname = path.split('/')[-1]
shutil.copyfile(path, os.path.join(outdirpath,dname+'_'+fname))
if __name__ == '__main__':
parser = argparse.ArgumentParser(formatter_class=argparse.ArgumentDefaultsHelpFormatter)
parser.add_argument('--outdir', type=str, required=True, help='path to output directory.')
parser.add_argument('--trgfile', type=str, required=True, help='name of target file.')
opt = parser.parse_args()
gatherfiles(opt.outdir, opt.trgfile)
我希望新命名的文件存储在输出文件中,而不会互相覆盖。
答案 0 :(得分:1)
解析器的参数--trgfile
包含一个字符串。
但是您使用通配符调用脚本:—trgfile ./*/protein.faa
。
此通配符然后被评估为多个字符串,因此出现无法识别的参数错误。
将trgfile更改为接受多个值(添加nargs='+'
),或使用单个trgfile调用脚本。
答案 1 :(得分:1)
您正在从外壳程序运行它,外壳程序进行了自己的全局扩展。如果您想传递参数
./*/protein.faa
对于未展开的程序,您需要对其进行转义以保护它不受外壳保护,例如。
'./*/protein.faa'
或者,如Taek所说,您可以更改函数和arg解析器以接受目标路径的预展开列表。