我想从数据框中的列中删除不需要的符号。我该怎么做呢? (我正在使用Python)

时间:2019-06-27 19:00:30

标签: pandas dataframe data-analysis

[1]:https://i.stack.imgur.com/FYgSp.png [1]

我已包含一个指向数据框头部图像的链接。如您所见,“价格”列中包含句点,逗号,美元符号以及其他货币的价格。

我想遍历价格列中的所有元素,并删除数字以外的所有内容。而且,我想要的唯一数字是用加元显示商品价格的数字。

这是我尝试过的代码

df['prices']=df['prices'].map(lambda x: x.strip('.,'))

这没有用。我也尝试了以下方法

df['prices']=df['prices'].map(lambda x: x.lstrip('.,').rstrip('CA'))

这也不起作用。

您会建议我做什么?如果您还可以解释为什么使用所使用的代码,那么这将对我学习Python语言有极大帮助。 :)

1 个答案:

答案 0 :(得分:0)

尝试使用:

df['prices']=df['prices'].apply(lambda x: re.sub('[^0-9]+', ‘’, x))

编辑:我错过了您说只想要加拿大货币的部分。因此,假设中间部分(CA1234)是加拿大货币的格式,

df['prices']=df['prices'].apply(lambda x: float(x.split(“,”)[1][2:]))