提取值后如何转换值?

时间:2018-08-30 09:57:15

标签: scrapy scrapinghub portia

我正在使用Portia从页面提取信息。但是,提取的值之一不是我可以使用的格式。

更具体地说,我想提取一个使用点而不是逗号来表示数千个数字的数值。用“ 1.000”代替“ 1,000”。

是否可以提取并使用Portia进行转化?我可以设置一个正则表达式来提取数字,但是也可以替换它们吗?

我现在要做的是将数据导出到csv,然后使用sed替换有问题的数字。

谢谢

1 个答案:

答案 0 :(得分:0)

检查:How do I use Python to convert a string to a number if it has commas in it as thousands separators?

import locale
locale.setlocale( locale.LC_ALL, 'de_DE.UTF-8' )
locale.atoi('1.000')
# 1000

基本上是用正确的格式掩码编号的字符串