Python在+ - 字符上拆分字符串

时间:2016-01-18 23:57:32

标签: python split

我有以下字符串“158.8±0.7”,通过beautifulsoup从别人的html中提取。我想将它分成数字和错误值作为浮点数。我不能让split函数拆分为±字符。

我试过了:

num, err = "158.8 ± 0.7".split('±')
num, err = "158.8 ± 0.7".split(u'U+00B1')
num, err = "158.8 ± 0.7".split('±')

但这些都不起作用。有什么想法吗?

我正在使用Python 2.7

更新

我添加# -*- coding: utf-8 -*-作为我的代码的第一行,现在我收到错误UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 1: ordinal not in range(128)。还有什么进一步的建议吗?

2 个答案:

答案 0 :(得分:0)

在文件顶部,执行:

# -*- coding: utf-8 -*-

这将允许处理非ASCII字符。

然后使用re模块进行拆分,

import re
re.split('\W±', "158.8 ± 0.7")

答案 1 :(得分:0)

# -*- coding: utf-8 -*-

在文件的开头设置unicode编码。您发布的第一个示例将运行良好。