subject = page.select('div.container h1')
subject = [x.text.replace('2015', '')for x in subject]
print subject
[u'\u20132016 Art Courses']# This is the code after.
[u'2015\u20132016 Art Courses']#This is the code before.
subject = [x.text.replace('20132016', '')for x in subject]
当我尝试将.replace更改为' 20132016'它打印出来 [u' 2015 \ u20132016艺术课程']
有谁知道如何摆脱20132016以及单词
课程。
答案 0 :(得分:2)
您的字符串中没有字符“2013”。你有一个单字符,unicode 2013,即“ - ”,一个短划线。你需要替换那个角色。
x.text.replace(/u'u20132016', '') for x in subject]
答案 1 :(得分:1)
\u2013
是一个unicode符号en dash
。例如,请检查here。
所以除了Art之外,你需要像这样替换它:
>>> a = u'2015\u20132016 Art Courses'
>>> a.replace(u'2015\u20132016', '').replace('Courses', '').strip()
u'Art'