如何使用每个或循环来解析内部多个<p>标签文本?

时间:2019-04-25 12:03:42

标签: javascript node.js web-scraping cheerio

我想解析多个<p>文本中的新闻文本。无法从这些p标签中获取文本。

示例网址:https://www.prothomalo.com/sports/article/1590573

我找到了所有带有标签的<p>标签文本。但是我只想获取带有循环或其他内容的文本。需要帮助仅获取这些文本。

我的带有<p>标签的解决方案:

$('#widget_51897 > div > div > div.row.detail_holder > div.right_part > div > article > div').text()

请给我关于cheerio(NodejS)的解决方案 预先感谢

2 个答案:

答案 0 :(得分:1)

const allPElements = document.getElementsByTagName('p');

for(let {innerText} of allPElements){
  console.log(innerText);
}

答案 1 :(得分:0)

听起来您想获得[itemprop="articleBody"]下的所有p文本:

const texts = $('[itemprop="articleBody"] p').map((i, p) => $(p).text()).get()