从字符串中提取带有逗号的数字

时间:2019-08-05 23:57:17

标签: python-3.x string pandas extract

我想从房屋描述栏中提取一些平方米。例如,我使用了:

df['description'].str.extract('(\d\,\d{1,3}\s?[sS])', expand=True)

从看起来像“房子为3,000平方米”的字符串中提取3000。

如果要提取800平方米怎么办?因此,不涉及逗号的条件。我如何将其添加到条件中。抱歉,我环顾四周,仍然无法弄清。

1 个答案:

答案 0 :(得分:1)

我正在使用str.findall

s=pd.Series(['llll llll llll 100,000.00 lll lll ll ','xyz 800 bgm bhd','80','1,000.00 and 10'])
s.str.findall(r'(?:[,\d]+.?\d*)')
0      [100,000.00]
1             [800]
2              [80]
3    [1,000.00, 10]
dtype: object