JS Puppeteer-如何刮擦桌子

时间:2020-03-26 00:52:18

标签: javascript html web-scraping puppeteer

我不太了解Javascript或Puppeteer,我想知道如何抓取下表:

Table I Want To Scrape

我要刮擦体内<tr>...</tr><td class="className">...</td>的所有东西 enter image description here

有解决方案吗?

2 个答案:

答案 0 :(得分:0)

let text = await page.evaluate (() => document.querySelector('tbody').innerText)

答案 1 :(得分:0)

可能看起来像这样:

await page.evaluate (() => {
  return [...document.querySelectorAll('.tbrdr tbody tr')].map(tr => {
    return [...tr.querySelectorAll('td.className')].map(td => td.innerText)
  })
})