试图找到一个模式"到DestinationLocation"在一个巨大的文本blob。 使用以下内容:
pattern = re.compile("to (.*)")
string = #text blob
pattern.search(string)
# When I see the output
>>> _.group(1)
DestinationLocation blah blah blah ...
如何仅提取' DestinatiionLocation'从捕获的文本?
答案 0 :(得分:2)
您想要找到一个仅由字母字符组成的单词,长度为1或更长,不会吞下空格,所以请使用\w+
(单个alpha长度为1 +):
pattern = re.compile("to (\w+)")
现在,如果单词实际上是单词(如to the mall
),您将需要一些字符来表示单词序列的结尾,如to the mall.
(点限制器),以及包含可用字符集的包含空格,以点结尾:
pattern = re.compile("to ([\w ]+)\.")