代码:
$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;
我得到的输出只是数组。这意味着它是空的。我确信div正在我正在抓取的页面上预设。
另外,我想要实现的另一件事是,从html中获取文本。当我简单地将其转换为纯文本时,会导致许多不需要的数字和内容。所以我要做的是,获取我在浏览器中看到的文本。 (而不是从html中获取整个文本)。
欢迎所有建议。
答案 0 :(得分:8)
看起来您正在输出整个文档。尝试
echo $ret->innertext;
只输出div的内容。
PS:我刚刚在google上查看了这个内容并找到了http://simplehtmldom.sourceforge.net/manual.htm