Question

我正在尝试阅读包含阿拉伯文字的网页的源代码，但所有内容都是جامعة（不是阿拉伯语，只是一组字符）。

如果我在本地主机上重新加载页面，我会正确获取阿拉伯语标签和文本。但我真的需要阅读该源代码。我可以添加任何建议或代码行？

<html dir=rtl>

<META http-equiv=Content-Type content=text/html;charset=windows-1256>

这几行包括使用的“编码”！该页面使用 HTML 和 PHP

编写

Answer 1

字符仅转义为HTML实体。浏览器在呈现页面时将其解码为“真实字符”。您可以使用html_entity_decode自行解码：

html_entity_decode('&#1580;&#1575;&#1605;&#1593;&#1577;', ENT_COMPAT, 'UTF-8')

请注意最后一个参数，该参数设置将字符解码为的编码。使用你在内部使用的任何编码，我只是在这里建议使用UTF-8。