用javascript注入的HTML

时间:2013-06-25 15:28:52

标签: php parsing dom xml-parsing html-parsing

解析通过JavaScript插入html的HTML页面是什么好方法? 查看源时,以下页面Parcel report不显示表或表数据。我最好的猜测是这是因为表格是通过JavaScript插入的。那么在这种情况下,抓取这些数据的好方法是什么?

我希望将文件转储成字符串并使用与此类似的方法打印表格,但我愿意听取任何建议。

 $html_import = ???
 $html->loadHTML($html_import);
 $td = $html->getElementsByTagname('td');
 foreach($td as $tds) {
 printf(" * %s\n", $tds->textContent);
 echo '<br>';

}

1 个答案:

答案 0 :(得分:1)

如果查看页面加载时发出的HTTP请求,您将看到AJAX请求消失。

GET http://gis.catawbacountync.gov/_rest/v0/ws_ims_attribute_query.php?parameters=pinc+%3D+%27374219517154%27&table=ws_parcel_report3&fields=*&orderby=&format=json

这就是实际检索所需数据的内容。如果您可以访问该API,则可以轻松获得所需信息。

由于这是一个政府网站,我怀疑他们需要向您提供此信息,因此需要API。

如果您只是试图通过试用/错误拼凑API,请确保您没有违反任何使用条款。