删除文本文件中的非utf8行

时间:2013-01-28 07:04:15

标签: string utf-8 notepad++ keyword

如何在文本文件中仅删除非utf8关键字/行。

例如

你好
相手123abc
this is only abc

我只想删除包含所有英文单词的行,而不是删除包含utf8单词的行。所以在这种情况下,只有'这只是abc'才会被删除。是否可以在notepad ++中执行此操作,还是需要为其编写脚本?

1 个答案:

答案 0 :(得分:5)

使用以下步骤可以实现这一点;

  • 打开Notepad ++,选择查找菜单并选择最后一个标签'标记',输入正则表达式^(([a-zA-Z])+\s?)+,选择书签行,然后单击“全部标记”按钮。

    Marking English only files as bookmarked

  • 从下拉菜单中选择;搜索 - >书签 - >删除已添加书签的行

    Finished file

我还建议确保Notepad ++是最新的。我用6.3版测试了这个。标记线是最近添加的东西。