我正在尝试在我的网站上支持多种语言。一些需要翻译的内容将包含Ç
等实体引用。我可以使用htmlentities
将其转换为Ã
。但是,如果我需要翻译带有标记的字符串,该怎么办:
"<p>Hello, <a href="">world with Ç</a></p>"
如果我使用htmlentities
,<
和>
也会被转换。我不想将字符串分解为标记和非标记部分,然后仅将htmlentities
应用于非标记部分。那太乱了,太乏味了。
答案 0 :(得分:1)
已发布here
的工作将您的字符串传递给以下函数并使用返回的字符串。
function unicode_escape_sequences($str){
$working = json_encode($str);
$working = preg_replace('/\\\u([0-9a-z]{4})/', '&#x$1;', $working);
return json_decode($working);
}