Python重新提取模式后的第一个单词

时间:2016-12-20 16:44:18

标签: python regex

试图找到一个模式"到DestinationLocation"在一个巨大的文本blob。 使用以下内容:

pattern = re.compile("to (.*)")
string = #text blob
pattern.search(string)
# When I see the output
>>> _.group(1)
DestinationLocation blah blah blah ...

如何仅提取' DestinatiionLocation'从捕获的文本?

1 个答案:

答案 0 :(得分:2)

您想要找到一个仅由字母字符组成的单词,长度为1或更长,不会吞下空格,所以请使用\w+(单个alpha长度为1 +):

pattern = re.compile("to (\w+)")

现在,如果单词实际上是单词(如to the mall),您将需要一些字符来表示单词序列的结尾,如to the mall.(点限制器),以及包含可用字符集的包含空格,以点结尾:

pattern = re.compile("to ([\w ]+)\.")