HTML源代码不懂阿拉伯文字?

时间:2011-09-25 07:08:18

标签: php html encoding

我正在尝试阅读包含阿拉伯文字的网页的源代码,但所有内容都是جامعة(不是阿拉伯语,只是一组字符)。

如果我在本地主机上重新加载页面,我会正确获取阿拉伯语标签和文本。 但我真的需要阅读该源代码。我可以添加任何建议或代码行?

<html dir=rtl>

<META http-equiv=Content-Type content=text/html;charset=windows-1256>

这几行包括使用的“编码”!该页面使用 HTML PHP

编写

1 个答案:

答案 0 :(得分:6)

字符仅转义为HTML实体。浏览器在呈现页面时将其解码为“真实字符”。您可以使用html_entity_decode自行解码:

html_entity_decode('&#1580;&#1575;&#1605;&#1593;&#1577;', ENT_COMPAT, 'UTF-8')

请注意最后一个参数,该参数设置将字符解码为的编码。使用你在内部使用的任何编码,我只是在这里建议使用UTF-8。