我试图抓住这个静态页面上找到的表格:
http://www.asx.com.au/prices/targetratetracker.htm
使用基于UI的简单刮刀发现here进行测试,即使使用KeepEverythingExtractor
设置,也可以看到它不会返回表格。
在targetratetracker.htm
页面上使用Inspector,我们可以看到以下内容:
A Parser-blocking, cross-origin script, http://www.adobetag.com/d4/v2/.../amc.js, is invoked via document.write.
我不知道要使用哪个库或语言,只是想知道是否有解决方法(如果这确实是问题)。