[1]:https://i.stack.imgur.com/FYgSp.png [1]
我已包含一个指向数据框头部图像的链接。如您所见,“价格”列中包含句点,逗号,美元符号以及其他货币的价格。
我想遍历价格列中的所有元素,并删除数字以外的所有内容。而且,我想要的唯一数字是用加元显示商品价格的数字。
这是我尝试过的代码
df['prices']=df['prices'].map(lambda x: x.strip('.,'))
这没有用。我也尝试了以下方法
df['prices']=df['prices'].map(lambda x: x.lstrip('.,').rstrip('CA'))
这也不起作用。
您会建议我做什么?如果您还可以解释为什么使用所使用的代码,那么这将对我学习Python语言有极大帮助。 :)
答案 0 :(得分:0)
尝试使用:
df['prices']=df['prices'].apply(lambda x: re.sub('[^0-9]+', ‘’, x))
编辑:我错过了您说只想要加拿大货币的部分。因此,假设中间部分(CA1234)是加拿大货币的格式,
df['prices']=df['prices'].apply(lambda x: float(x.split(“,”)[1][2:]))