我有以下字符串“158.8±0.7”,通过beautifulsoup从别人的html中提取。我想将它分成数字和错误值作为浮点数。我不能让split函数拆分为±字符。
我试过了:
num, err = "158.8 ± 0.7".split('±')
num, err = "158.8 ± 0.7".split(u'U+00B1')
num, err = "158.8 ± 0.7".split('±')
但这些都不起作用。有什么想法吗?
我正在使用Python 2.7
更新
我添加# -*- coding: utf-8 -*-
作为我的代码的第一行,现在我收到错误UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 1: ordinal not in range(128)
。还有什么进一步的建议吗?
答案 0 :(得分:0)
在文件顶部,执行:
# -*- coding: utf-8 -*-
这将允许处理非ASCII字符。
然后使用re模块进行拆分,
import re
re.split('\W±', "158.8 ± 0.7")
答案 1 :(得分:0)
把
# -*- coding: utf-8 -*-
在文件的开头设置unicode编码。您发布的第一个示例将运行良好。