我正在使用一个由PowerShell脚本(不是我的)生成的文本文件,它似乎在实际输出行的中间添加了一堆换行符。
它看起来像这样:
line 1: text text text text te
xt text text text text text te
xt text
line 2: text text text text te
xt text text text text text te
xt text
etc...
什么时候应该是这样的:
line 1: text text text text text text text text text text text text
line 2: text text text text text text text text text text text text
etc...
我在想我应该能够使用Notepad ++或者某些东西来进行高级查找和替换(可能使用RegEx?)并且只删除前面的字符数正好是30个字符(或任意数字)的换行符)。
有人可以建议一种方法来实现这个目标吗?
谢谢!
答案 0 :(得分:1)
如果它实际上只有22个字符分隔,您可以尝试
(.{22})\n\s*
需要替换为
$1
<小时/>
为了更安全,请考虑使用nltk
(例如Python
)或尝试获取初始源代码。