将String.startswith()与unicode字符串一起使用

时间:2015-06-18 17:58:10

标签: python-2.7 unicode

我正在尝试使用BeautifulSoup修剪从HTML页面中删除的字符串。它以

开头
 – 

在html页面中。我正在尝试以下代码:

if thestring.startswith(unichr(160) + '-' + unichr(160)):
    print "found starting sequence"
    thestring= thestring[3:]

但是,我没有触发if条件(由于我的print语句没有发生这一事实证实)。我该如何设置这个条件?

(同样在某些情况下,thestring最初只有3个字符,在这种情况下我希望字符串最终成为空字符串 - 这样做还是我需要单独测试那个案例?)

1 个答案:

答案 0 :(得分:0)

使用thestring.__repr__()我能够确定bs给我的是一个以u'\xa0\u2013\xa0'开头的字符串

然后以下代码适用于我:

if thestring.startswith(u"\xA0\u2013\xA0"):
    print "found starting sequence"
    thestring = thestring[3:]