为什么正则表达式[[:alpha:]]也匹配Notepad ++中的中文单词?例如,中文
根据Notepad ++的文档
alpha:ASCII字母
中文单词不是ASCII字母,为什么正则表达式与它们匹配?
答案 0 :(得分:18)
[:alpha:]
类通常匹配字母字符。这将远远超过ASCII字母,具体取决于您使用的编码。
虽然Notepad++ documentation确实表示" ASCII字母",但它也表示使用Boost C++ Regex library实现正则表达式。文档确认[:alpha:]
has the standard, broader meaning in this library。
这似乎只是Notepad ++文档中的一个错误。
如果您需要匹配ASCII字母,我会使用[a-zA-Z]
之类的东西作为起点。