我有一个文本文件,其中包含使用制表符缩进而不是缩进的行。它看起来像:
A a1,asdf,lkjhj
some thing here
B MORE THINGS,HERE
C MORE TEXTS HERE
HERE ALSO TEXTS
AND SO
我想加入以前的缩进线。
结果如下:
A a1,asdf,lkjhj some thing here
B MORE THINGS,HERE
C MORE TEXTS HERE HERE ALSO TEXTS AND SO
由于该文件有超过22,000行,我尝试使用notepad ++模块Npp
使用Python脚本自动化。我试过这个:
import sys
from Npp import *
notepad.open("input.txt")
i= 0
line=editor.gotoLine(i)
if line.startsWith('^[\t]' ) :
notepad.runMenuCommand( 'Macro','line join')
else:
pass
i=i+1
print 'done'
Notpad.save()
这不起作用。我该如何解决?
答案 0 :(得分:3)
作为使用Notepad ++的替代方法,您可以直接使用Python来修改输入文件:
with open('input.txt', 'r') as f_input:
text = f_input.read()
text = re.sub(r'(^.*?(?=\n\S+|\Z))', lambda x: re.sub(r"(\n\s+)", " ", x.group(1)), text, flags=re.M+re.S)
with open('input.txt', 'w') as f_output:
f_output.write(text)
这会给你以下输出:
A a1,asdf,lkjhj some thing here
B MORE THINGS,HERE
C MORE TEXTS HERE HERE ALSO TEXTS AND SO