html_entity_decode并非所有实体都转换回

时间:2018-12-26 04:28:40

标签: php laravel

我在基于ubuntu的操作系统上使用PHP 7.2,并遇到了这个问题。搜索stackoverflow仅表明以下几点:

php artisan tinker
>>> html_entity_decode('® ™', ENT_COMPAT, 'UTF-8');
=> "® ™"
>>> html_entity_decode('® ™', ENT_QUOTES | ENT_HTML5, 'UTF-8');
=> "® ™"

online demo

如您所见,™未转换回™,但®已正确转换。

有什么建议吗?我怎么知道要为™使用哪种编码?

1 个答案:

答案 0 :(得分:1)

在HTML编码字符集中,未使用127-159。没有为153分配任何字符。也许这就是为什么它没有转换。

specification 中检查您的编码字符。

我检查了一点。 ™的代码为8482。现在看来,它可以正常工作。

检查demo