为什么simple_html_dom不能获取特定网页的div内容,但是它适用于同一网站上的其他网页

时间:2015-11-24 15:03:49

标签: php web-scraping simple-html-dom

我正试图从此网址<{1}}标记获取plaintext title

<div id="title"></div>

我正在使用像这样的

https://thepiratebay.gd/torrent/12745130/

这给了我

<?php 
require_once('simple_html_dom.php');

$torrent_page_url = 'https://thepiratebay.gd/torrent/12745130/';

$html = file_get_html($torrent_page_url);

$title = $html->find('div[id=title]', 0)->plaintext ;

echo ( $title);
?>

当我检查它显示的网址来源时

Notice: Trying to get property of non-object in file.php on line 8

如果我从

更改网址
<div id="title">
        WWE Table For 3 S01E10 Kings Court 720p WEBRip h264-WD -={SPARRO</div>

任何其他网址具有相同结构的同一网站,例如页

$torrent_page_url = 'https://thepiratebay.gd/torrent/12745130/';

我得到了正确的输出。

e.g。

$torrent_page_url = 'https://thepiratebay.gd/torrent/12829104/';
$torrent_page_url = https://thepiratebay.gd/torrent/12745118/';

和网址源显示

Jugaadi Dot Com (2015) DvDRip x264 AC3 [DDR]

那么为什么我的代码不适用于某些页面而其工作正常呢?即使所有这些页面都有相同的标记/ html源。

我缺少什么?

simple_html_dom http://simplehtmldom.sourceforge.net/

0 个答案:

没有答案