如何从Msonormal类中抓取特定单词?

时间:2019-02-14 13:29:17

标签: javascript html node.js web-scraping cheerio

我正在尝试在node.js中创建一个Web抓取工具,但是我似乎找不到合适的类来获取名称“ Lord Neuberger”。

我对JavaScript相对陌生,并且遵循了一个教程来创建一个刮板,该刮板可以从Wikipedia中获得美国总统的姓名和生日。我正在尝试将从中学到的内容应用于其他网站,但是它们的HTML格式不同。

这是HTML代码的示例。

< p class=Title1 align=left style='margin-left:0cm'>< span
style='font-size:20.0pt'>FirstGroup Plc (Respondent) < i>v< /i> Paulley
(Appellant)< /span></p>

< p class=MsoNormal>< b>< span style='font-size:16.0pt'>&nbsp;< /span>< /b>< /p>

< p class=MsoNormal>< b><span style='font-size:16.0pt'>&nbsp;< /span></b>< /p>

< p class=MsoNormal>< b><span style='font-size:14.0pt'>before < /span>< /b>< /p>

< p class=MsoNormal>< b><span style='font-size:16.0pt'>&nbsp;< /span>< /b>< /p>

< p class=MsoNormal>< b><span style='font-size:17.0pt'>Lord Neuberger, President< /span>< /b>< /p>

< p class=MsoNormal>< b><span style='font-size:17.0pt'>Lady Hale, Deputy President< /span>< /b>< /p>

0 个答案:

没有答案