我有一个df行,如下所示,让这些列称为col1, col2, col3 ad col4
-
facility 20% xyzzz facility 40% alsnan
我要删除以比较第二列和第四列中的值。为此,我只希望列中的20%和40%。
我在想我的输出看起来像-
facility 20% facility 40%
比较这些值会更容易。
我如何实现这一目标。
答案 0 :(得分:2)
使用pandas.Series.str.extract
:
for c in ['col2', 'col4']:
df[c] = df[c].str.extract('(\d+%)')
print(df)
输出:
col1 col2 col3 col4
0 facility 20% facility 40%
答案 1 :(得分:0)
df.drop('column name', axis=1, inplace=True) #if you want to replace permantly the data frame