使用Chrome scraper从JavaScript网站中提取数据

时间:2013-09-29 14:17:54

标签: javascript excel google-chrome web-scraping screen-scraping

我需要从此网站提取数据: http://www.guidetorulingtheworld.ca/Path/apps/cato/sortfims.aspx?FirmRegionNumber=12&locality=A

我需要与这些公司联系,因为他们是潜在的雇主,我只能为他们工作以获得我的名称。在这个网站上总共有另外10个左右的类似页面列出了我需要应用这种方法的公司(约300家公司)。

我尝试在资源管理器上使用Chrome和数据工具上的刮刀,但是没有完全使用此网站。实际上,资源管理器的数据工具没有任何反应。

公司联系信息嵌入在每个公司的JavaScript中,并在点击时显示。 scraper工具提取JavaScript的URL,但不提取结果数据。是否有我可以使用的扩展程序或Excel VBA脚本,并会自动在JavaScript中提取数据?

1 个答案:

答案 0 :(得分:0)

如果您是Java程序员,请使用HTML单元 - 虽然它是单元测试库,但它对Web抓取很有用。这是完全支持JavaScript的无头浏览器。