从UTF-8字符串中删除ASCII不可打印字符是否安全?

时间:2017-05-15 06:20:05

标签: utf-8 ascii

我将用户输入的字符串(UTF-8)解析为ASCII,并根据此PCRE表达式删除所有字符:/[\x00-\x1F\x7F]/。我想知道这是否会导致任何UTF-8角色出现某种腐败现象?

谢谢!

1 个答案:

答案 0 :(得分:1)

好吧,你要杀死所有与你指定的值相等的代码点(0到31和127);因为UTF-8多字节序列都是由高位设置(> = 128)的字节组成的,所以没有破坏其他任何东西的风险。