使用Php将表提取为文本

时间:2013-01-30 21:29:26

标签: php web-scraping match

我正在寻找一种简单的方法来获取网页的第一个表格并将整个事物放入一个字符串中,就是这样。

所以我需要知道如何使用preg_match或类似方法从DOM对象获取表的第一个实例,并将整个事件转换为字符串:

我有一个类将网页下载为DOM,但我无法将html转换为字符串,因为我需要它。

$nodes = $this->bot->QuerySelector($this->download['DOM'], "//table[1][@class='tyebfghjftsdf-ccfkk']");

请帮忙

1 个答案:

答案 0 :(得分:0)

我会使用Tidy将页面转换为有效的XHTML,然后使用XML阅读器(不构建DOM)读取它,并在找到标记时开始回显数据并在标记上终止。没有正则表达式。