CMS的动态网络刮擦表

时间:2012-10-04 05:08:17

标签: javascript python drupal web-scraping html-table

当我无法访问服务器端脚本时,是否有人建议我如何抓取每天从网站更新的表格?具体来说,我使用CMS - Drupal - 并且无法访问托管服务器,也无法创建或修改模块。我相信这排除了Python,PHP等的使用。

有没有办法抓取网站的HTML,解析表格,并使用Javascript在我的网页上显示其数据(或完整显示表格)?我读过有关Node.js和其他依赖PHP等语言的脚本,但正如我所说,我不相信我可以运行这些。

任何建议或线索都会对您有所帮助。我对这些功能的运行方式的了解最少。

编辑--- 我应该提到它具有相同的域..动态更新的内容位于我无法访问的子目录中。我想这听起来有点傻,但这就是我所处的情况。

1 个答案:

答案 0 :(得分:0)

由于same origin policy,您无法通过javascript访问外部网站。

但是,如果该网站位于同一个域中,我猜您可以调整答案中显示的代码this question