我正在尝试阅读包含阿拉伯文字的网页的源代码,但所有内容都是جامعة
(不是阿拉伯语,只是一组字符)。
如果我在本地主机上重新加载页面,我会正确获取阿拉伯语标签和文本。 但我真的需要阅读该源代码。我可以添加任何建议或代码行?
<html dir=rtl>
<META http-equiv=Content-Type content=text/html;charset=windows-1256>
这几行包括使用的“编码”!该页面使用 HTML 和 PHP
编写答案 0 :(得分:6)
字符仅转义为HTML实体。浏览器在呈现页面时将其解码为“真实字符”。您可以使用html_entity_decode
自行解码:
html_entity_decode('جامعة', ENT_COMPAT, 'UTF-8')
请注意最后一个参数,该参数设置将字符解码为的编码。使用你在内部使用的任何编码,我只是在这里建议使用UTF-8。