我想通过使用正则表达式字符串从html标签或网页中提取文本? 以下是我想要提取的任务;
1
<div>Want to extract this text</div>
2
<span>want to extract this text</span>
3
<span>+91 11 3989 0000</span>
4需要在这里提取地址(香港约克街40号)
<p class="location"><i class="fa fa-map-marker"></i> No 40 york street Hongkong </p>
5需要在此处提取网站(网址)(www.website.com)
<p class="location"><i class="fa fa-link"></i> <a href="http://www.website.com" target="_blank">www.website.com</a></p>
6需要在此处提取电子邮件地址(emailaddress@yahoo.com)
<p class="location"><i class="fa fa-envelope"></i> emailaddress@yahoo.com</p>
这种类型的任务如何使用正则表达式?我使用webharvy从网站上抓取一些数据。 有没有转换器这样做? 希望你的指导。