Puppeteer:如何在ec2服务器上安装puppeteer

时间:2018-11-21 12:18:58

标签: node.js amazon-ec2 chromium puppeteer

我想在ec2服务器上安装Puppeteer。因此,是否需要在每台要抓取数据的计算机上都安装puppeteer和Chrome。

3 个答案:

答案 0 :(得分:0)

在安装puppeteer时,会自动安装铬。您唯一需要注意的是,您应该以无头模式运行它。.如果您想以非无头模式(即使用GUI)运行它,则需要安装带有EC2的VNC服务器并启动脚本通过VNC。就您不需要专门在无头模式下运行它而言,您所需要做的就是

  • npm i

  • npm start

木偶戏带有它自己的铬生成物。

答案 1 :(得分:0)

在EC2上安装人偶可能是一件棘手的事情。还有另一个问题尚未解决。

要回答您的问题,您不必担心会单独下载Chromium,因为npm i puppeteer会负责下载与操纵up的人兼容的Chromium,并负责其余的工作。

但是,您将遇到的更麻烦的问题是确保在EC2上安装了必需的依赖项才能运行Puppeteer。这些依赖关系在发行版之间有所不同(CentOS,Ubuntu / Debian等)。

执行以下步骤,

  1. 安装所需的所有依赖项。您可以参考此链接获取列表, https://github.com/GoogleChrome/puppeteer/blob/master/docs/troubleshooting.md#chrome-headless-doesnt-launch-on-unix
  2. 在安装所有依赖项之后,如果您位于VPC /代理之后,请安装npm并在.npmrc中配置代理。
  3. 然后像往常一样继续进行npm i puppeteer并照常进行

让我知道这是否可行,如果您有任何疑问,请与我联系。

答案 2 :(得分:-1)

您只需要安装puppeteerpuppeteer自动下载与之兼容的Chromium版本-一切都可以立即使用!

因此,一旦您安装了puppeteer,就已经可以使用了!

有关更多信息,请参见puppeteer自述文件:
https://github.com/GoogleChrome/puppeteer#readme