我想从房屋描述栏中提取一些平方米。例如,我使用了:
df['description'].str.extract('(\d\,\d{1,3}\s?[sS])', expand=True)
从看起来像“房子为3,000平方米”的字符串中提取3000。
如果要提取800平方米怎么办?因此,不涉及逗号的条件。我如何将其添加到条件中。抱歉,我环顾四周,仍然无法弄清。
答案 0 :(得分:1)
我正在使用str.findall
s=pd.Series(['llll llll llll 100,000.00 lll lll ll ','xyz 800 bgm bhd','80','1,000.00 and 10'])
s.str.findall(r'(?:[,\d]+.?\d*)')
0 [100,000.00]
1 [800]
2 [80]
3 [1,000.00, 10]
dtype: object