如何使用正则表达式刮取html标签中的一些文本?

时间:2018-05-19 19:10:55

标签: html regex

我想通过使用正则表达式字符串从html标签或网页中提取文本? 以下是我想要提取的任务;

1

<div>Want to extract this text</div>

2

<span>want to extract this text</span>

3

<span>+91 11 3989 0000</span>

4需要在这里提取地址(香港约克街40号)

<p class="location"><i class="fa fa-map-marker"></i> No 40 york street Hongkong </p>

5需要在此处提取网站(网址)(www.website.com)

<p class="location"><i class="fa fa-link"></i> <a href="http://www.website.com" target="_blank">www.website.com</a></p>

6需要在此处提取电子邮件地址(emailaddress@yahoo.com)

<p class="location"><i class="fa fa-envelope"></i> emailaddress@yahoo.com</p>

这种类型的任务如何使用正则表达式?我使用webharvy从网站上抓取一些数据。 有没有转换器这样做? 希望你的指导。

0 个答案:

没有答案