Cheerio:保留换行符

时间:2019-01-24 08:36:03

标签: javascript web-crawler cheerio

<td align="center"><font face="Verdana"><font size=2><b> 3792&nbsp;R</b><br><font size=1>tp WHR3</font><br></font><font size=1><a href="http://www.lyngsat-maps.com/footprints/NSS-9-West-hemi.html">West hemi</a><br>39-40</font></td>

我想得到

  1. 3792 R
  2. tp WHR3
  3. 西半边
  4. 39-40

cheerio代码->

$('td', td).text()

获取文本[ 3792Rtp WHR3West hemi39-40 ]

1 个答案:

答案 0 :(得分:0)

您可以使用CSS选择器来定位<td>中的特定元素:

const value1 = $('td font[face=Verdana] font[size=2] b').text() // 3792 R
const value2 =  $('td font[face=Verdana] font[size=2] font[size=1]').text() // tp WHR3
const value3 = $('td > font[size=1] a').text() // West hemi
const value4 = $('td > font[size=1]').text().substring(value3.length - 1) // 39-40

您需要检索的最后一个值未包含在特定元素内,因此我检索了包含value3value4的父元素的值,并减去了{{1} },剩下的就是value3