我有一个非常大的文本文件。 此文本文件中的每一行都有一个完整的句子。 现在我必须删除其中包含超过x个字符的每一行/句子,并且只保留< = x个字符的行。
这甚至可能吗?我可以用Notepad ++ / EditPlus或正则表达式吗?
感谢您的帮助!
答案 0 :(得分:8)
这是Notepad ++的解决方案
在搜索模式中选择“正则表达式”。确保“。匹配换行符”复选框未选中。
找到:.{x}.+
替换为:(空)
如果您不想在更换后留空线:
找到:.{x}.+(\r?\n|\n|$)
将x
替换为您选择的号码。
答案 1 :(得分:6)
使用bash:
$ awk '{if (length($0) <= x) print $0; }' myfyle.txt
x
的长度。它将打印小于x
的行。
有关更多awk好东西,请参阅Awk Tutorial and Introduction。
答案 2 :(得分:1)
这是Editplus版本3.70的解决方案。
如果要保留&lt; = 200的行,以下内容将删除任何201个字符或更多的行。
注意201之后的逗号。