使用影子根隐藏刮刀中的数据

时间:2014-04-03 00:27:31

标签: javascript html5 web-scraping web-crawler web-component

阴影根是否始终可以从与根本身相同的窗口/框架/页面中的任何javascript上下文访问?

如果是,则无法通过将其放在阴影根中来隐藏来自网络抓取工具的数据。

如果它不总是可访问的(例如,如果存在某种奇怪的“交叉起源”安全策略)那么某些元素的影子根中呈现的(对用户可见)但不是逻辑DOM内容可能是某些人无法访问的该页面上的javascript上下文 - 因此允许从(非极端OCR)刮刀隐藏数据。

由于我在数据刮刀业务,我希望它是前者!

1 个答案:

答案 0 :(得分:1)

以下是规范的说法:

  

为了便于调用回调,相关的相似来源浏览上下文的每个单元都有一个处理堆栈,该堆栈最初是空的。堆栈中的每个项目都是一个元素队列,它最初也是空的。元素队列中的每个项目都是自定义元素。

如果要隐藏数据,可以选择以下两个选项:

<强>参考