通过Chrome扩展程序在后台抓取其他网站

时间:2020-01-05 18:14:07

标签: javascript google-chrome web-scraping google-chrome-extension

我正在尝试创建一个扩展程序,该扩展程序将抓取6个特定站点,然后将解析后的数据发送到Google Firebase后端进行存储。到目前为止,我知道我需要将6个站点添加到manifest.json,然后使用某种库来帮助在background.js中进行解析。有人在使用chrome扩展解析时有指向教程或库建议的指针吗?另外,我是否会遇到任何跨站点安全性问题,因为该插件会刮擦站点而无需在选项卡中打开并在后台进行操作(如果允许)?

我发现Cheerios是一个库,但似乎它需要Node,并且不认为这是一个选择。 ArtooJs和PhantonJS是另一种,但是没有得到积极的支持,因此可以在这里找到一个好的解决方案时参考人们的建议。

0 个答案:

没有答案