google chrome headless puppeteer获取页面的DOM

时间:2018-05-01 17:32:23

标签: google-chrome headless puppeteer

您好我想获取页面内容。 我使用doc中的page.content()。通过javascript渲染和处理但是源代码仍然让我不是DOM 我希望能够抓住iframe并通过javascript内容生成,就像是来自devtools chrome。 我也试试:

let bodyHTML = await page.evaluate(() => document.body.innerHTML);

这也给了我源代码。

这可能吗?

1 个答案:

答案 0 :(得分:0)

我不确定iframe,但使用此代码你可以得到内部文本。这对我有用。

    const body = await page.evaluate(() => {
    return {
            'body': document.body.innerText
        };
    });
    console.log('body:', body);