如何在不触及html标签的情况下解码西里尔字符

时间:2013-08-13 05:34:44

标签: php html-entities

我从远程源获取一些内容,其中一些内容输出如下的西里尔字符:

Щерката

浏览器可以读得很好,但某些程序存在问题。通过PHP的html_entity_decode()运行后,我可以得到正确的字符,文本如下:

Щерката

问题是html_entity_decode()还解码了字符串中的任何HTML标记,我不希望它们被触及。

有没有办法在不影响HTML标签的情况下这样做?

2 个答案:

答案 0 :(得分:0)

(Double)首先使用简单的<>str_replace()序列进行编码,然后执行解码

答案 1 :(得分:0)

var_dump(htmlspecialchars(html_entity_decode('&#1065;&lt;b&gt;')));

给我:

string(11) "Щ&lt;b&gt;"