我用木偶做了一个刮板,去了网站新闻 Ctrl + A 和 Ctrl + C 并将文本复制到文件中。
这是一个非常简单的脚本,但是使用Windows剪贴板却非常令人讨厌,因为如果我让脚本在后台运行,我将无法复制和粘贴任何内容。
是否有另一种方法可以在不使用Windows剪贴板的情况下从网站复制原始文本?用 raw 文字是指您访问网站并按 Ctrl + A 时可以看到的所有文字。
答案 0 :(得分:1)
您可以从document.body
获取innerText
值,该值应与 Ctrl + A相同(或至少非常相似)。 kbd>, Ctrl + C 会给您。
代码示例
const text = await page.evaluate(() => document.body.innerText);