我正在尝试在node.js中创建一个Web抓取工具,但是我似乎找不到合适的类来获取名称“ Lord Neuberger”。
我对JavaScript相对陌生,并且遵循了一个教程来创建一个刮板,该刮板可以从Wikipedia中获得美国总统的姓名和生日。我正在尝试将从中学到的内容应用于其他网站,但是它们的HTML格式不同。
这是HTML代码的示例。
< p class=Title1 align=left style='margin-left:0cm'>< span
style='font-size:20.0pt'>FirstGroup Plc (Respondent) < i>v< /i> Paulley
(Appellant)< /span></p>
< p class=MsoNormal>< b>< span style='font-size:16.0pt'> < /span>< /b>< /p>
< p class=MsoNormal>< b><span style='font-size:16.0pt'> < /span></b>< /p>
< p class=MsoNormal>< b><span style='font-size:14.0pt'>before < /span>< /b>< /p>
< p class=MsoNormal>< b><span style='font-size:16.0pt'> < /span>< /b>< /p>
< p class=MsoNormal>< b><span style='font-size:17.0pt'>Lord Neuberger, President< /span>< /b>< /p>
< p class=MsoNormal>< b><span style='font-size:17.0pt'>Lady Hale, Deputy President< /span>< /b>< /p>