xpath获取波斯语字符的html

时间:2014-02-17 06:53:01

标签: php xpath unicode persian

我使用此方法获取波斯语网页的内部html:

private static function getInnerHTML($node)
{
    $innerHTML = "";
    $children = $node->childNodes;
    foreach ($children as $child) {
        $tmp_doc = new DOMDocument();
        $tmp_doc->appendChild($tmp_doc->importNode($child,true));
        $innerHTML .= $tmp_doc->saveHTML();
    }
    return $innerHTML;
}

当我在浏览器中看到源代码时,我发现波斯语字符如下:

گزارش

如何将此编码转换为常规波斯语字符?

例如,这个字符必须是: گزارش

抱歉,我不知道这是什么编码,所以我以前无法搜索它。

感谢。

1 个答案:

答案 0 :(得分:1)

根据我的评论,您需要的是html_entity_decode

$innerHTML .= html_entity_decode($tmp_doc->saveHTML());

<强> DEMO