用于span标记中的地址的正则表达式

时间:2013-02-02 04:55:32

标签: regex

我需要从这样的样本中提取一个会在每个新页面上发生变化的地址。所以我需要一个正则表达式从以下的html代码片段中提取100个E Faith Ter。

<span style="..." class="addr">100 E Faith Ter<br>
    <span class="locality">Maitland</span>,
    <span class="region">FL</span>
    <span class="postal-code">32751</span>
</span>

我正在使用Javascript。

2 个答案:

答案 0 :(得分:0)

您没有指定语言,正则表达式与语言无关,但它们在指定如何处理多行方面有所不同。在javascript中:/^.*$/m选择第一行。

将您的问题更新为完整HTML而非原始文本后,您可以使用:

^\<.+?\>(.+?)\<br\>$

并检索第一个带括号的子匹配(确保使用多行选项)

答案 1 :(得分:0)

The Pony He Comes!!

整个事情不需要正则表达式。相反,只需使用strip所有HTML标记 - 如果您使用的是PHP,strip_tags可以很好地执行此操作,否则您可以使用空字符串替换<[^>]+>。你应该得到地址的纯文本。然后,您可以将其拆分为单独的行。

或者你可能只是这个人:

xkcd