网络抓取:某些数据(图像)似乎无法抓取?

时间:2018-07-04 14:40:27

标签: javascript python html selenium web-scraping

我正在尝试使用Python,Selenium和Firefox从网站获取图像URL,但是似乎我无法解决这种情况?没有元素,但是显示图像。当我在Firefox中使用“检查”时,它会建议以下图像元素,但是我看不到任何有关图像源的信息:

<canvas width="575" height="575" id="orbitvu-2154214-obj-canvas" class="orbitvu-viewer-object-canvas zindexer" style="margin: 0px; padding: 0px; box-sizing: border-box; line-height: 0; width: 100%; height: 100%; display: block; background-color: rgb(255, 255, 255); opacity: 1;"></canvas>

我还可以看到firefox在下载网站时下载了图像,并且图像下载是由网站中嵌入的js脚本触发的。因此,我认为此脚本在这里起到了神奇的作用-它下载图像,并以某种方式使浏览器将其付诸东流,而最终HTML源中没有可用于标识图像源位置的内容。 我想知道是否有些情况下根本不可能刮取日期,也许这就是其中之一?

1 个答案:

答案 0 :(得分:0)

那不是图像,而是画布元素。画布用于在网页上绘制图形,但是您可以将图像绘制到画布上,尽管这可能是您混淆的地方。图像很可能会流下来,然后JavaScript将其绘制到画布上,查看其JavaScript源代码以了解更多信息,或者链接我们的URL,以便我们可以查看

相关问题