Question

代码：

$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;

我得到的输出只是数组。这意味着它是空的。我确信div正在我正在抓取的页面上预设。

另外，我想要实现的另一件事是，从html中获取文本。当我简单地将其转换为纯文本时，会导致许多不需要的数字和内容。所以我要做的是，获取我在浏览器中看到的文本。（而不是从html中获取整个文本）。

欢迎所有建议。

Answer 1

看起来您正在输出整个文档。尝试

echo $ret->innertext;

只输出div的内容。

PS：我刚刚在google上查看了这个内容并找到了http://simplehtmldom.sourceforge.net/manual.htm