标签: utf-8 ascii
我将用户输入的字符串(UTF-8)解析为ASCII,并根据此PCRE表达式删除所有字符:/[\x00-\x1F\x7F]/。我想知道这是否会导致任何UTF-8角色出现某种腐败现象?
/[\x00-\x1F\x7F]/
谢谢!
答案 0 :(得分:1)
好吧,你要杀死所有与你指定的值相等的代码点(0到31和127);因为UTF-8多字节序列都是由高位设置(> = 128)的字节组成的,所以没有破坏其他任何东西的风险。