抓取/废弃单个网页的DOM然后重新呈现它?

时间:2016-12-10 18:17:18

标签: google-chrome-extension web-scraping web-crawler data-extraction domcrawler

我想抓取/抓取给定网址的Dom并在另一个网址上重新呈现它。这是针对增长黑客工具的目的

一个例子是,我想重新呈现页面http://x.com/x.html

  1. 我浏览http://example.com/render?url=http://x.com/x.html
  2. 我在服务器端吮吸http://x.com/x.html的DOM内容
  3. 我重新渲染了糟糕的DOM内容,保持所有依赖关系不变。
  4. 这样做的目的是像ChromeExtension那样操纵DOM,但不需要任何扩展。这可以在任何浏览器上使用。

    由于我保留了所有原始依赖项(资产的URL:images / js / CSS ...),我可以使用相同的设计和我的其他DOM修改重新渲染相同的页面。

    我做了很少的实验,这很好。但我的问题是,这是可扩展的吗? 在法律方面呢?我可以被原始网站所有者绳之以法(即使没有任何骗局或欺诈意图)? 你有什么建议吗?

0 个答案:

没有答案