我有一个制表符分隔的文件,我需要用管道定界。最简单的方法是什么?
我是python的新手,所以我没有尝试任何东西。 Google在这方面做得不好。我一直在Notepadd ++中进行查找/替换。
我得到的是什么
A 0MT0371755 I ZZTEST PERSON NP 2015-12-15
预期:
A|0MT0371755|I||ZZTEST|PERSON|||NP|2015-12-15|
答案 0 :(得分:0)
在Python中,我们可以尝试使用re.sub
:
input = "A\t0MT0371755\tI\tZZTEST\tPERSON\tNP\t2015-12-15"
input = re.sub(r'\t', '|', input)
在Notepad ++上,只需在正则表达式模式下搜索\t
,然后替换为|
。
答案 1 :(得分:0)
最简单/最好的方法是对字符串使用.replace()
方法:
input_text = "A\t0MT0371755\tI\tZZTEST\tPERSON\tNP\t2015-12-15"
output_text = input_text.replace('\t', '|') # \t is a tab character
答案 2 :(得分:0)
with open('file.in', 'r') as orig, open('file.out', 'w') as out:
out.write(orig.read().replace('\t', '|'))