如何访问要从中提取数据的网站的控制台?

时间:2018-08-20 18:04:38

标签: javascript html dom

抱歉,标题令人困惑。我是JavaScript的初学者,想构建这个小项目来提高我的技能水平:图像提取器。用户可以将网站名称输入到表单输入中。按提取,将显示所有图像的链接。

问题:如何访问在输入字段中输入的网站DOM?

2 个答案:

答案 0 :(得分:1)

正如@Quentin在评论中提到的那样,浏览器对跨域请求实施了这样的限制。 Same Origin policy将阻止您的网站提取其他域上页面的HTML源。

由于这是一项学习活动,因此我建议选择另一项不会引起跨域请求安全性问题的任务。另外,您可以使用Node(JavaScript),Python,PHP,Ruby或许多其他脚本语言在浏览器中实现这样的“抓取器”。

答案 1 :(得分:0)

如果您已经有了html内容,则可以尝试执行以下操作:

var html = document.createElement('html');
html.innerHTML = "<html><body><div><img src='image-url.png'></div></body></html>";
console.log(html.querySelector("img").src);

如果您还需要通过ajax调用来获取内容,我建议使用scrapy