我使用DOM加载了一些HTML。
$html = file_get_contents($page);
$dom = new DomDocument('1.0', 'UTF-8');
@$dom->loadHTML(mb_convert_encoding($html, 'HTML-ENTITIES', 'UTF-8'));
$finder = new DomXPath($dom);
当我得到一些带有xpath($finder->query($xpath)->item(0)->nodeValue
)的文本并尝试回显它时,像áíýé这样的字符就可以了,但是像žřčš这样的字符却被显示为标记。
已加载的文档包含<meta charset="utf-8">
。
有人可以帮助我吗?