Question

我有一个df行，如下所示，让这些列称为col1, col2, col3 ad col4-

 facility   20% xyzzz   facility   40% alsnan

我要删除以比较第二列和第四列中的值。为此，我只希望列中的20％和40％。

我在想我的输出看起来像-

 facility   20%  facility   40%

比较这些值会更容易。

我如何实现这一目标。

Answer 1

使用pandas.Series.str.extract：

for c in ['col2', 'col4']:
    df[c] = df[c].str.extract('(\d+%)')
print(df)

输出：

       col1 col2      col3 col4
0  facility  20%  facility  40%

Answer 2

df.drop('column name', axis=1, inplace=True) #if you want to replace permantly the data frame