我有以下字符串:
s = u'アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)'
然而,当我尝试摆脱角色(
及其后的所有内容时,它并不匹配:
>>> print re.sub(r'\(.+$', '', s)
アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)
我如何才能获得字符串:
アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~
答案 0 :(得分:2)
您应确保re.sub()
的所有参数都属于同一类型 - str
或unicode
。试试这个:
# encoding: utf-8
import re
s = u'アガサ・クリスティー 奥さまは名探偵 ~パディントン発4時50分~(字幕版)'
print re.sub(ur'\(.+$', u'', s)