自动执行Google外卖下载

时间:2019-01-22 21:38:44

标签: google-apps-script automation puppeteer

是否可以通过编程方式启动/安排Google外卖下载(所有46种以上服务)数据

https://takeout.google.com/

我想定期备份此数据(本地或Google云端硬盘)

在没有Google API的情况下,可以使用Puppeteer自动执行用户点击吗?

1 个答案:

答案 0 :(得分:0)

是的,绝对有可能。我建议使用无头浏览器,例如Selenium或Puppeteer。有几个步骤可以完成此任务:

1)自动登录Google(如果需要)
2)自动导航到Google Takeout并下载数据
3解析数据
4)编写脚本,以便您可以定期自动完成整个过程。

编写网页抓取工具时,还需要注意以下几点:

以无头模式运行浏览器时,提供的HTML可能不同于非无头运行的浏览器。换句话说,可以使用不同的名称来命名DOM元素上的属性,并且由于您使用这些属性来自动执行诸如选择和单击之类的操作-您的代码将需要更改。因此,通过浏览器检查元素是一个不错的起点,但是在无头模式下运行时,您可能需要调整属性名称,这对于入门起着帮助作用。例如,以下代码摘录显示了用于登录Google的相同代码,为Puppeteer编写了两种方式。一种写成无头,另一种写成无头:

无头模式:

(async () => {
    const browser = await puppeteer.launch();
    const page = await browser.newPage();
    await page.goto('https://takeout.google.com');


    await page.waitForSelector('input[type=email]')
    await page.type('input[type=email]', process.env.GOOGLE_USER)
    await page.click('#next')

    await page.waitForSelector('#Passwd', { visible: true })
    await page.type('#Passwd', process.env.GOOGLE_PWD);
    await page.waitForSelector('#signIn', { visible: true })
    await page.click('#signIn');

    await page.waitForNavigation()
    await browser.close();

})();

无头模式:

(async () => {
    const browser = await puppeteer.launch({ headless: false, slowMo: 50 })
    const page = await browser.newPage()
    await page.goto('https://takeout.google.com');


    await page.waitForSelector('input[type="email"]')
    await page.type('input[type="email"]', process.env.GOOGLE_USER)
    await page.click('#identifierNext')

    await page.waitForSelector('input[type="password"]', { visible: true })
    await page.type('input[type="password"]', process.env.GOOGLE_PWD)
    await page.waitForSelector('#passwordNext', { visible: true })
    await page.click('#passwordNext')


    await page.waitForNavigation()
    await browser.close()
})()