切片从HTML中提取的字符串

时间:2016-08-18 10:06:23

标签: python python-unicode

我使用

从网页中提取了一些数据
y = soup.find('td', attrs={'data'}).string

当我尝试使用float()时,我收到错误消息,它是float()的隐藏文字。所以我试图通过使用print(repr(y))来找出问题所在。 这给了我以下结果。

u'\r\n                450,990\r\n            '

我意识到你的意思是unicode,但我怎么能把它变成一种格式让我可以漂浮()呢?

先谢谢你,先发帖,所以请怜悯。

1 个答案:

答案 0 :(得分:0)

>>> y = str(u'\r\n                450,990\r\n            ')
>>> map(float, y.strip().split(','))
[450.0, 990.0]

>>> float(y.strip().replace(',',''))
450990.0

>>> float(y.strip().replace(',','.'))
450.99