如何将编码从纯文本更改为Unicode,以便我可以从HTML中读取特殊字符?

时间:2015-10-09 15:32:00

标签: php parsing simple-html-dom

以下是我的代码:

<?php
// example of how to use basic selector to retrieve HTML contents
include('/Library/WebServer/Documents/simple_html_dom.php');  //this is the api for the simplehtmldom

// get DOM from URL or file
$html = file_get_html('http:/www.google.hk');



// extract text from table
echo $html->find('td[align="top"]', 1)->innertext.'<br><hr>';

// extract text from HTML
echo $html->innertext;
?>

我正在使用simplephphtmldon API。当我在我的本地服务器中执行我的 php 程序时,我得到了许多无法识别的字符,因为纯文本无法真正对它们进行编码以显示它们应该如此。有人可以告诉我需要更改为inner text以便让所有角色出现吗? PS我也没试过运行plaintexttextContent似乎对我不利。也许我需要先尝试不同的元素(?)。感谢

0 个答案:

没有答案