在div标签之间提取文本 - 简单的Html Dom Parser

时间:2012-04-29 16:59:52

标签: php parsing dom

代码:

$html = file_get_html('http://url.com');
$ret = $html->find('div[samplediv]');
echo $ret;

我得到的输出只是数组。这意味着它是空的。我确信div正在我正在抓取的页面上预设。

另外,我想要实现的另一件事是,从html中获取文本。当我简单地将其转换为纯文本时,会导致许多不需要的数字和内容。所以我要做的是,获取我在浏览器中看到的文本。 (而不是从html中获取整个文本)。

欢迎所有建议。

1 个答案:

答案 0 :(得分:8)

看起来您正在输出整个文档。尝试

echo $ret->innertext;

只输出div的内容。

PS:我刚刚在google上查看了这个内容并找到了http://simplehtmldom.sourceforge.net/manual.htm