尝试使用cheerio在两个样式元素之间提取HTML

时间:2019-05-21 08:05:48

标签: web-scraping cheerio

我正在抓取HTML页面,但是我试图获取页面的一部分。我感觉没有类,ID或任何超级有用的东西都可以插入到Cheerio中(我是新来的,所以我知道我的无知在起作用)。

代码看起来像这样。

<b> Here's some text I don't want</b>
<b> More text I don't want</b>

<hr style="width:90%; padding: 0>
<b> text I want </b>
<b> text I want </b>
<b> text I want </b>
<b> text I want </b>
<hr style="width:90%; padding: 0>

<b> Here's some text I don't want</b>
<b> More text I don't want</b>

有没有一种方法用Cheerio来捕获两个<hr>元素之间的HTML?这两个元素完全相同。

2 个答案:

答案 0 :(得分:1)

您可以从第一个小时开始,然后迭代next()直到到达第二个:

Folder

答案 1 :(得分:0)

如果您确定要使用第n个,则可以尝试使用nth-of-type选择器,例如

hr:nth-of-type(1)

您也许还可以使用nth-child