是否可以通过编程方式启动/安排Google外卖下载(所有46种以上服务)数据
我想定期备份此数据(本地或Google云端硬盘)
在没有Google API的情况下,可以使用Puppeteer
自动执行用户点击吗?
答案 0 :(得分:0)
是的,绝对有可能。我建议使用无头浏览器,例如Selenium或Puppeteer。有几个步骤可以完成此任务:
1)自动登录Google(如果需要)
2)自动导航到Google Takeout并下载数据
3解析数据
4)编写脚本,以便您可以定期自动完成整个过程。
编写网页抓取工具时,还需要注意以下几点:
以无头模式运行浏览器时,提供的HTML可能不同于非无头运行的浏览器。换句话说,可以使用不同的名称来命名DOM元素上的属性,并且由于您使用这些属性来自动执行诸如选择和单击之类的操作-您的代码将需要更改。因此,通过浏览器检查元素是一个不错的起点,但是在无头模式下运行时,您可能需要调整属性名称,这对于入门起着帮助作用。例如,以下代码摘录显示了用于登录Google的相同代码,为Puppeteer编写了两种方式。一种写成无头,另一种写成无头:
无头模式:
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://takeout.google.com');
await page.waitForSelector('input[type=email]')
await page.type('input[type=email]', process.env.GOOGLE_USER)
await page.click('#next')
await page.waitForSelector('#Passwd', { visible: true })
await page.type('#Passwd', process.env.GOOGLE_PWD);
await page.waitForSelector('#signIn', { visible: true })
await page.click('#signIn');
await page.waitForNavigation()
await browser.close();
})();
无头模式:
(async () => {
const browser = await puppeteer.launch({ headless: false, slowMo: 50 })
const page = await browser.newPage()
await page.goto('https://takeout.google.com');
await page.waitForSelector('input[type="email"]')
await page.type('input[type="email"]', process.env.GOOGLE_USER)
await page.click('#identifierNext')
await page.waitForSelector('input[type="password"]', { visible: true })
await page.type('input[type="password"]', process.env.GOOGLE_PWD)
await page.waitForSelector('#passwordNext', { visible: true })
await page.click('#passwordNext')
await page.waitForNavigation()
await browser.close()
})()