从熊猫数据帧的每个单元格中删除所有逗号

时间:2021-01-31 21:06:40

标签: python pandas dataframe substring

假设我有一个如下的数据框:

d = {'col1': ['hello','nice to meet you', 'i like pudding, apples, bananas' ], 'col2': ['good','nice,cool','awesome']}

df = pd.DataFrame(data=d)

只要数据单元格中有逗号,我想对字符串进行子集化,使其成为逗号之前的所有内容。例如

df.iloc[2,0] #should read "i like pudding" 
df.iloc[1,1] #should read "nice" 

我尝试过 np.where() 并对字符串进行子集化,但在我的真实数据框中,由于多次出现相同的字符串,这变得很复杂。有没有一种简单的方法可以遍历所有单元格,检查逗号,然后将该字符串子集化为仅包含第一个逗号之前的字符?

1 个答案:

答案 0 :(得分:2)

您需要用逗号分割每个单元格,然后保留第一个字符串。

df = df.applymap(lambda x: x.split(',')[0])
相关问题