re.sub with Japanese Characters

时间:2016-04-27 18:18:43

标签: python regex

我有以下字符串:

s = u'アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)'

然而,当我尝试摆脱角色及其后的所有内容时,它并不匹配:

>>> print re.sub(r'\(.+$', '', s)
アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)

我如何才能获得字符串:

アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~

1 个答案:

答案 0 :(得分:2)

您应确保re.sub()的所有参数都属于同一类型 - strunicode。试试这个:

# encoding: utf-8

import re
s = u'アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)'
print re.sub(ur'\(.+$', u'', s)