在一个大型文本文件中,我想提取出现后" RA" +6号码的所有地方。我该怎么做?
例如,我希望新的txt文件看起来像
RA000000
RA111111
RA222222
RA333333
RA444444
RA的其他实例也没有出现。
答案 0 :(得分:0)
这可能对您有用:
import re
with open('input.txt') as input_file:
ra_list = re.findall(r'RA\d{6}', input_file.read())
with open('output.txt', 'w') as output_file:
output_file.write('\n'.join(ra_list) + '\n')
测试输入:
hello
RA111111 goodbye
RA2222 RA333
abcRA45678912345
结果:
RA111111
RA456789
答案 1 :(得分:0)
正则表达式是' ^(RA \ d {6})$'。然后每次找到捕获组1时打印。