我正在使用
(?<=Activties</h3>)[\w\s\/\,\-\.]*
从这里提取文本,但我只获得第一行。我想在下一个&#34; h3风格&#34;之前捕捉所有线路。 &#34; br&#34;并不重要。是否被捕获
<h3 style="margin: 10px 0px 0px;">Beach Type</h3> sand <h3 style="margin: 10px 0px 0px;">Facilities</h3> Cafes/restaurant<br>Toilets<br>Disabled toilets<br> <h3 style="margin: 10px 0px 0px;">Activities</h3> Swimming<br>Fishing<br>Snorkeling<br> <h3 style="margin: 10px 0px 0px;">Nature and Wildlife</h3> Grandes Rocques is located at the start of Guernsey's 14km west coast footpath and cycle route. Port Soif Nature Trail and the Saumarez Nature trail are also located nearby. There is a diverse range of wildlife here. The first live Green Turtle to be rec <h3 style="margin: 10px 0px 0px;">Parking</h3> 200 spaces are available <h3 style="margin: 10px 0px 0px;">Water Quality</h3> Excellent <h3 style="margin: 10px 0px 0px;">Lifeguard</h3> No <h3 style="margin: 10px 0px 0px;">Cleaning and Litter</h3> The beach is cleaned daily by hand in the summer and twice a week in winter. There are litter and dog bins present. <h3 style="margin: 10px 0px 0px;">Awards and Recommendations</h3> Marine Conservation Society Recommended<br>
任何帮助将不胜感激。 谢谢你看
omeganos
答案 0 :(得分:0)
用哪种语言?
通常最好使用HTML / DOM解析器从HTML获取数据。我很确定这就是这种情况。
您的角色类中没有<>
括号。为什么它应与<br>
代码匹配?
你在哪里告诉模式在下一个<h3 style
停止?
答案 1 :(得分:0)
这是一个相当模糊的问题,但这样的事情能够实现你所要求的:
(?<=Activities</h3>)(.*?)<h3
如果需要,您可以使.*?
更具限制性。 .*
表示匹配任何内容,而?
表示非贪婪(因此它会在找到的第一个<h3
停止,而不是最后一个。