我正在使用api,它以01234⇒56789
的形式返回一些数据。有时这些数据只有数字不是问题,但有时会返回⇒
字符。由于我必须自动选择箭头后面的数字(非ascii字符)的过滤过程,我必须知道字符何时包含非ascii字符。
我使用decode(utf-8)
并返回u'01234\u21d256789'
。我试过split('\u21d2')
,但字符串没有拆分。任何帮助表示赞赏。
答案 0 :(得分:1)
python3:
>>> s = "01234⇒56789"
>>> s
'01234⇒56789'
>>> s.split("⇒")
['01234', '56789']
python2:
>>> s = u"01234⇒56789"
>>> s.split(u"⇒")
[u'01234', u'56789']
Python2中的关键点是指定您处理unicode字符串。在Python3中,默认情况下字符串是unicode,并且bytes类型