当我在cgi脚本中输入编码为utf8的字符串时,它转换为下划线
示例1:
我上传了一个文件"تجربة.jpeg"
我找到了名为"__________.jpeg"
示例2:我上传了一个文件"1(1).jpeg"
我找到了名为"1_1_.jpeg"
我认为有两种可能性:
basename
那你觉得怎么样?
答案 0 :(得分:0)
问题是一个正则表达形式,将所有字符转换为a-z,A-Z,0-9为“_”
正则表达式:s/[^a-zA-Z0-9-_\.]/_/gs
我刚刚添加了一系列我需要的字符,所以最终结果是:
正则表达式:s/[^a-z-A-Z0-9-_\.]/_/gs
答案 1 :(得分:0)
匹配alpha,不带UTF8:
/a-zA-Z/
匹配alpha,UTF-8和Latin1中的重音字符:
/[:alpha:]/
无需为下一位开发人员进一步复杂化。