Python Regex匹配和排除某些内容

时间:2015-01-06 10:52:31

标签: python regex

我正在尝试从字符串中排除某些内容。这是一个例子:

Sony Xperia Z2 m/Smartwatch 2

Sony Xperia Z2 + headphones

我想只获得

Sony Xperia Z2

两种情况。

我已经能够匹配我想摆脱的字符串,但我如何选择逆? 到目前为止我得到了什么:

 m/([a-zA-Z 0-9]*)

编辑:我添加了另一个案例。

4 个答案:

答案 0 :(得分:2)

使用正则表达式拆分

re.split(r" m/| \+ ", yourString)[0]

这适用于您的两个示例:

string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[0]
# output: Sony Xperia Z2

string2 = "Sony Xperia Z2 + headphones"
print re.split(" m/| \+ ", string2)[0]
# output: Sony Xperia Z2

如果您有更多分隔符,可以将它们添加到split函数的模式中。

您还可以使用re.split(...)[1]检索字符串的第二部分:

string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[1]
# output: Smartwatch 2

答案 1 :(得分:1)

您可以使用:

>>> s = 'Sony Xperia Z2 m/Smartwatch 2'
>>> re.sub(r'\s*m/.*$', '', s)
'Sony Xperia Z2'

答案 2 :(得分:1)

使用正则表达式

>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")
['Sony Xperia Z2']

>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")[0]
'Sony Xperia Z2'

使用拆分

>>> "Sony Xperia Z2 m/Smartwatch 2".split(" m/")[0]
'Sony Xperia Z2'

答案 3 :(得分:0)

类似的东西:

test = 'Sony Xperia Z2 m/Smartwatch 2'
res = re.search('m/([a-zA-Z 0-9]*)', test)
cleanstr = test.replace(res.group(), '')
print cleanstr

你得到了Sony Xperia Z2