我想在ec2服务器上安装Puppeteer。因此,是否需要在每台要抓取数据的计算机上都安装puppeteer和Chrome。
答案 0 :(得分:0)
在安装puppeteer时,会自动安装铬。您唯一需要注意的是,您应该以无头模式运行它。.如果您想以非无头模式(即使用GUI)运行它,则需要安装带有EC2的VNC服务器并启动脚本通过VNC。就您不需要专门在无头模式下运行它而言,您所需要做的就是
npm i
npm start
木偶戏带有它自己的铬生成物。
答案 1 :(得分:0)
在EC2上安装人偶可能是一件棘手的事情。还有另一个问题尚未解决。
要回答您的问题,您不必担心会单独下载Chromium,因为npm i puppeteer
会负责下载与操纵up的人兼容的Chromium,并负责其余的工作。
但是,您将遇到的更麻烦的问题是确保在EC2上安装了必需的依赖项才能运行Puppeteer。这些依赖关系在发行版之间有所不同(CentOS,Ubuntu / Debian等)。
执行以下步骤,
npm
并在.npmrc
中配置代理。npm i puppeteer
并照常进行让我知道这是否可行,如果您有任何疑问,请与我联系。
答案 2 :(得分:-1)
您只需要安装puppeteer
。 puppeteer
自动下载与之兼容的Chromium版本-一切都可以立即使用!
因此,一旦您安装了puppeteer
,就已经可以使用了!
有关更多信息,请参见puppeteer
自述文件:
https://github.com/GoogleChrome/puppeteer#readme