如何使用simplehtmldom

时间:2015-12-04 08:42:01

标签: html parsing dom html-parsing

我正在使用名为' simplehtmldom'的解析库。我想要做的就是提取表格单元格的文本内容。这就是全部!看起来很简单......我试过的一切都会导致整个FRIGIN页面被抛弃,因为显然所有的原语都是向上,向下和横向穿过dom树。这是我尝试做的一个简单的例子:

$saved = '';
foreach($html->find('tr') as $tr) {
    foreach($tr->find('td') as $td) {
        $contents = $td->plaintext;
        if ($saved) {
            echo "$saved : $contents<br>\n";
            $saved = '';
        }
        if (strstr($contents, 'Title') || strstr($contents, 'Author')) {
            $saved = $contents;
        }
    }
}

我尝试过使用&#39;明文&#39; innertext&#39;和&#39; text&#39;,但无论我尝试什么,我最终都会得到无尽的废话回荡,或者根本没有。

有谁知道如何使用这个解析器?或者可以建议一个替代方案来做我想做的事情?

1 个答案:

答案 0 :(得分:0)

CAVEAT - 这不是一个真正的答案,而是另一种选择。

我关闭了这个问题,因为我能够使用不同的方法解决问题,DOM类提到了here。希望如果您只是想找到一种获取表格单元格内容的方法并且不受某种特定包裹或方法约束,这将节省一些时间。