我需要从这样的样本中提取一个会在每个新页面上发生变化的地址。所以我需要一个正则表达式从以下的html代码片段中提取100个E Faith Ter。
<span style="..." class="addr">100 E Faith Ter<br>
<span class="locality">Maitland</span>,
<span class="region">FL</span>
<span class="postal-code">32751</span>
</span>
我正在使用Javascript。
答案 0 :(得分:0)
您没有指定语言,正则表达式与语言无关,但它们在指定如何处理多行方面有所不同。在javascript中:/^.*$/m
选择第一行。
将您的问题更新为完整HTML而非原始文本后,您可以使用:
^\<.+?\>(.+?)\<br\>$
并检索第一个带括号的子匹配(确保使用多行选项)
答案 1 :(得分:0)
整个事情不需要正则表达式。相反,只需使用strip所有HTML标记 - 如果您使用的是PHP,strip_tags
可以很好地执行此操作,否则您可以使用空字符串替换<[^>]+>
。你应该得到地址的纯文本。然后,您可以将其拆分为单独的行。
或者你可能只是这个人: