具有可变前导和尾随字符的正则表达式匹配组

时间:2017-07-17 16:59:18

标签: regex

有一个单词模板用于从用户捕获数据。提供的值需要使用正则表达式提取。模板的部分如下所示:

located in ________________ County

因此,当用户填写数据时,输出可能具有可变数量的_前导和尾随字符。例如:

located in _______San Diego________ County

located in ________San Diego_______ County

located in _San Diego________ County

located in ________San Diego_____ County

located in San Diego County

目标是使用正则表达式从上面显示的任何示例中提取圣地亚哥。

2 个答案:

答案 0 :(得分:0)

_+([^_]+)_+

匹配组将匹配任意数量的_ s

之间的任何内容

答案 1 :(得分:0)

作为周杰伦答案的变种。使用前瞻和后方来捕获_(发现不止一个_是无关信息);并使用更独特的捕获组,以便只大声说出字母数字,空格和制表符。这将捕获同一句子中的_和文本行之间的任何文本。如果输入是有限长度,则可以将+替换为{1,#},其中#是输入的长度。

(?<=_)[A-Za-z0-9 \t]+(?=_)

要改进过滤器,需要更多地了解如何从有效组中分辨出流浪组。