我正在抓取HTML页面,但是我试图获取页面的一部分。我感觉没有类,ID或任何超级有用的东西都可以插入到Cheerio中(我是新来的,所以我知道我的无知在起作用)。
代码看起来像这样。
<b> Here's some text I don't want</b>
<b> More text I don't want</b>
<hr style="width:90%; padding: 0>
<b> text I want </b>
<b> text I want </b>
<b> text I want </b>
<b> text I want </b>
<hr style="width:90%; padding: 0>
<b> Here's some text I don't want</b>
<b> More text I don't want</b>
有没有一种方法用Cheerio来捕获两个<hr>
元素之间的HTML?这两个元素完全相同。
答案 0 :(得分:1)
您可以从第一个小时开始,然后迭代next()直到到达第二个:
Folder
答案 1 :(得分:0)
如果您确定要使用第n个,则可以尝试使用nth-of-type
选择器,例如
hr:nth-of-type(1)
您也许还可以使用nth-child