Question

我有以下字符串：

s = u'アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）'

然而，当我尝试摆脱角色（及其后的所有内容时，它并不匹配：

>>> print re.sub(r'\（.+$', '', s)
アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）

我如何才能获得字符串：

アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～

Answer 1

您应确保re.sub()的所有参数都属于同一类型 - str或unicode。试试这个：

# encoding: utf-8

import re
s = u'アガサ・クリスティー　奥さまは名探偵　～パディントン発4時50分～（字幕版）'
print re.sub(ur'\（.+$', u'', s)