我的网站和数据库设置为utf-8和utf8mb4。
在textareas上,当用户放置utf-8符号/表情符号时完全可以。
但是在某些输入字段(名称,地址等)上,我想消除那些“有趣的符号”的可能性,只处理基本的文本和数字,包括丹麦字符æøå,重音符号和-_'@之类的符号()?= ,.:;!“#&<>等
我将如何处理?
是否有一些本地php函数来去除unicode符号/字符,或者我是否必须为此找到/制作一个特定的regex函数?
答案 0 :(得分:4)
有一些用于检查编码的函数:http://php.net/manual/en/function.mb-check-encoding.php,但要去除字符,我认为您需要使用正则表达式:
function StripNonUTF($str){
return preg_replace('/[^\pL\pM[:ascii:]]+/g', '', $str);
}