Question

我想删除我的熊猫数据框的一列的所有非数字字符。我使用这一行：

     df.column.str.replace('[\D]', '')

当我将其应用于第一列时，我得到了第二列，但是我想要第三列：

Column                               Column after Replace        Desired output
330301 = 330324                      330301330324                330301330324

330381                               NaN                         330381

355047                               NaN                         355047

ALL 380307 / 380343                  380307380343                380307380343

第一行和最后一行是预期的输出，但是我不想删除其他值。我不明白为什么要这么做。

Answer 1

尝试一下：

pattern = re.compile('\D')
df[0].replace(pattern, '')

替换熊猫列的非数字内容

1 个答案: