(PHP)简单的HTML DOM解析器:HTML符号

时间:2013-04-02 12:51:26

标签: php json html-parsing special-characters simple-html-dom

我正在尝试从this website获取用户名,这就是我所做的:

$div = $html->find('div[class=micro-home-recent-review review-item]');
for ($i=0; $i<count($div); $i++){  
     $username = $div[$i]->find('div[class=tooltip-fullname]', 0)->find('b', 0)->plaintext;
     // I've tried using iconv but apparently it doesn't work
     $username = iconv(mb_detect_encoding($username), "UTF-8", $username); 
     $query = "INSERT INTO users ('name') VALUES ($username)";
     $pdo->query($query);
}

然后我数据库中新插入的记录是:

database records

正如您所看到的,大多数名称都是使用HTML符号记录的,这些符号可以在浏览器上正常显示,但在显示为JSON时会被搞砸。当我试图获得评论时会出现同样的问题,下面是评论的样本JSON:

enter image description here

我需要JSON在我的Android应用中显示数据,因此需要解决此问题或无法正确显示数据。对此可能有什么解决方案?我真的需要你的帮助和建议。

2 个答案:

答案 0 :(得分:1)

尝试使用html_entity_decode()功能。

答案 1 :(得分:1)

使用htmlentities_decode()来解决您的问题。