在整个上午花了一些关于Stack Overflow的问题后,我正在寻求帮助。我需要将Unicode实体和HTML实体转换为UTF-8文本。
$string = "Let's "Kiss & Makeup"";
//-> Let's Kiss & Makeup "lalala"
我设法单独解码HTML实体(使用html_entity_decode()
和htmlspecialchars_decode
)。即使这种广泛联系的Polyfill也没有。由于我没有试过解码Unicode实体的任何功能,我甚至没有尝试弄清楚解码功能的组合。
答案 0 :(得分:0)
唯一的问题是使用单引号和默认ENT_COMPAT
flag of html_entity_decode
,其中"单独留下单引号"。只需设置ENT_QUOTES
标志即可转换所有引号:
echo html_entity_decode($string, ENT_QUOTES | ENT_HTML401, 'UTF-8');