使用sublime text 3删除U + 200B零宽度空格字符

时间:2013-12-03 16:42:44

标签: python sublimetext3 sublime-text-plugin

如何使用崇高文本3制作U + 200B字符或删除它们。 我发现http://pastebin.com/ehWxNfMe但我不确定如何使用它

2 个答案:

答案 0 :(得分:12)

以下内容适用于Sublime Text 2和3.但是,由于后面讨论的一些问题,它有可能在编辑大文件时和/或在慢速计算机上阻止程序。使用异步方法的Sublime Text 3特定版本位于底部。

在Sublime中打开一个新文件,并将其语法设置为Python。将以下内容粘贴到其中:


import sublime_plugin

class ShowZeroWidthSpace(sublime_plugin.EventListener):
    def on_modified(self, view):
        spaces = []
        p = 0
        while True:
            s = view.find(u'\u200b', p + 1)
            if not s:
                break
            spaces.append(s)
            p = s.a

        if spaces:
            view.add_regions("zero-width", spaces, "invalid")
        else:
            view.erase_regions("zero-width")

将文件保存在Packages/User目录中show_zero_width_space.py,它应该立即开始工作。基本上它的作用是每当修改当前视图时,它会逐个字符地搜索它,寻找零宽度空格字符U+200B。如果找到一个,它会将该位置添加到列表中并一直查看,直到它到达文件末尾。然后,如果找到任何字符,则会根据主题中的invalid范围突出显示这些字符。突出显示后,可以选择并删除它们。

由于此插件每次都会运行视图(例如,每次按键后)都会运行,因此它有可能真正减慢Sublime,特别是对于大文件。因此,如果您正在处理您认为干净的文件,只需将插件重命名为show_zero_width_space.py.old,并确保删除任何名为show_zero_width_space.pyc的文件,它将不会处于活动状态。有关Sublime Text 3特定的解决方法,请参阅下文。


Sublime Text 3特定版本

EventListener的{​​{3}}现在包含on_modified_async()方法,与所有ST3函数现在都是线程安全的一致。这会以非阻塞方式异步运行代码,因此不应该减慢Sublime的速度。新插件如下:


import sublime_plugin

class ShowZeroWidthSpace(sublime_plugin.EventListener):
    def on_modified_async(self, view):
        spaces = []
        p = 0
        while True:
            s = view.find('\u200b', p + 1)
            if not s:
                break
            spaces.append(s)
            p = s.a

        if spaces:
            view.add_regions("zero-width", spaces, "invalid")
        else:
            view.erase_regions("zero-width")

答案 1 :(得分:9)

在Sublime Text中删除零宽度空格的最简单方法是使用搜索和替换功能:

  • Ctrl + h(Mac上为Alt + Cmd + f
  • 点击搜索面板上最左侧的按钮或按Alt + r(Mac上为Alt + Cmd + r)启用正则表达式标记
  • 输入\x{200b}作为搜索字词
  • 确保“替换为”字段为空并点击“全部替换”

用于解决此问题的插件!

我搜索了一个插件,它会突出显示所有可能的代码破解字符,但找不到Sublime Text的一个,所以我写了一个: https://github.com/TuureKaunisto/highlight-dodgy-chars

该插件采用白名单原则:设置中未列入白名单的所有非ascii字符都会突出显示。

如果你想根据自己的正则表达式突出显示内容,这个插件就可以解决问题:https://github.com/bluegray/Highlighter,也可以通过包管理器轻松安装。