如何知道数据是否包含非ascii字符?

时间:2014-12-11 09:38:02

标签: python ascii non-ascii-characters

我正在使用api,它以01234⇒56789的形式返回一些数据。有时这些数据只有数字不是问题,但有时会返回字符。由于我必须自动选择箭头后面的数字(非ascii字符)的过滤过程,我必须知道字符何时包含非ascii字符。

我使用decode(utf-8)并返回u'01234\u21d256789'。我试过split('\u21d2'),但字符串没有拆分。任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:1)

python3:

>>> s = "01234⇒56789"
>>> s
'01234⇒56789'
>>> s.split("⇒")
['01234', '56789']

python2:

>>> s = u"01234⇒56789"
>>> s.split(u"⇒")
[u'01234', u'56789']

Python2中的关键点是指定您处理unicode字符串。在Python3中,默认情况下字符串是unicode,并且bytes类型