我正在https://mobile.pugetsoundbasketball.com建立移动网站。
在主页(https://mobile.pugetsoundbasketball.com)上我使用DOMDocument从位于主网站(https://pugetsoundbasketball.com)的页面中提取特定div(#upcoming_league_dates)中的内容。
主网站是用WordPress构建的,我不想在移动网站上使用WordPress,因为我只需要拉几个WordPress页面。
$url = "https://pugetsoundbasketball.com/index.php";
$doc = new DomDocument('1.0', 'UTF-8');
$doc->validateOnParse = true;
$doc->loadHtml(file_get_contents($url));
$div = $doc->getElementById('upcoming_league_dates');
echo $doc->saveHTML($div);
这样可行,但我的问题是它显示了我认为的UTF-8字符,例如"男士"而不是"男人"。
我尝试更改WordPress中的文本,看看我是否可以通过这种方式修复它,但没有运气。
答案 0 :(得分:0)
告诉DOM从一开始就使用什么字符集:
$doc = new DOMDocument('1.0', 'UTF-8'); // note the UTF-8 option.
$doc->loadHTML(file_get_contents($url));