我正在尝试创建一个将一种文件类型转换为另一种文件类型的python脚本,我希望能够选择指定输出文件,但默认情况下只需更改默认文件名的扩展名。
例如:我希望convert('foo.gb')
输出foo.faa
,但convert('foo.gb', 'bar.faa')
输出bar.faa
我实现这个的方式是:
#!/usr/bin/env python
def convert(inputFile, outputFile = None):
[code that converts data]
if not outputFile:
import re
name = re.match('(.+)\.\w+', inputFile)
outputFile = './{0}.faa'.format(name.group(1))
with open(outputFile, 'w+') as outFaa:
outputFaa.write([stuff to write])
因此,它会检查是否已指定输出,如果未指定,则使用正则表达式将输入文件名更改为具有正确的扩展名。这段代码有效,但似乎有点草率,或者至少不是很易读。如果文件名在扩展名之前的任何地方都有.
,它也可能会中断。
有更好的方法吗?
答案 0 :(得分:2)
请将友好人员提供的电池用于Python安装。请查看os.path
,尤其是splitext。
然后你可以这样写:
def convert(filename, changeto=None):
basename, ext = os.path.splitext(in)
if changeto is None:
return basename + ".faa"
return changeto
在您的应用程序中,您需要处理路径结构。我只想将上面的函数用于不包含目录分隔符的文件名。
答案 1 :(得分:1)
import os
if output_fname is None:
basename, ext = os.path.splitext(input_fname)
output_fname = basename + ".faa"
请参阅https://docs.python.org/3.4/library/os.path.html
上的文档编辑:它不错;我唯一要做的就是让输出文件名处理成为函数中的第一件事。这使得下一个人更容易找出参数的来源以及如何正确使用它们:
import os
def convert(in_fname, out_fname = None):
# start by sanitizing parameters
if out_fname is None:
basename, ext = os.path.splitext(in_fname)
out_fname = basename + ".faa"
# read data
with open(in_fname) as inf:
data = inf.read() # or inf.readlines()
# do conversion
result = do_conversion(data)
# write result
with open(out_fname, "w") as outf:
outf.write(result) # or .write("\n".join(result))