^Category:\s(.*Movies|Movies RU|Sports|Movies HD| Movies EN HD|Movies RU HD|Documentaries|TV|TV EN)\s
它与所描述的内容相匹配,但它也在Category line之后提供其他信息。
只想匹配:
^Category:_whitespace_(Movies|Movies RU|Sports|Movies HD| Movies EN HD|Movies RU HD|Documentaries|TV|TV EN)_whitespace_
应该忽略在_whitespace_
之后发生的所有事情。
我忘了什么?
答案 0 :(得分:0)
$
是正则表达式的行尾符号(simillary为^
是行的开头符号)。
答案 1 :(得分:0)
好的,我认为整理出来了。它不是最佳解决方案,但它对我有用。
p = re.compile(ur'^Category:.*?(Movies|Movies RU|Sports|Movies HD| Movies EN HD|Movies RU HD|Documentaries|TV|TV EN)\s')
m = p.search(description)
if m:
final = m.group(0).replace('Category:', '')
else:
final = 'None'