删除文本文件中特定字符位置的换行符

时间:2018-04-18 18:59:13

标签: regex text-files

我正在使用一个由PowerShell脚本(不是我的)生成的文本文件,它似乎在实际输出行的中间添加了一堆换行符。

它看起来像这样:

    line 1: text text text text te
    xt text text text text text te
    xt text
    line 2: text text text text te
    xt text text text text text te
    xt text
    etc...

什么时候应该是这样的:

    line 1: text text text text text text text text text text text text
    line 2: text text text text text text text text text text text text
    etc...

我在想我应该能够使用Notepad ++或者某些东西来进行高级查找和替换(可能使用RegEx?)并且只删除前面的字符数正好是30个字符(或任意数字)的换行符)。

有人可以建议一种方法来实现这个目标吗?

谢谢!

1 个答案:

答案 0 :(得分:1)

如果它实际上只有22个字符分隔,您可以尝试

(.{22})\n\s*

需要替换为

$1

a demo on regex101.com

<小时/> 为了更安全,请考虑使用nltk(例如Python)或尝试获取初始源代码。