替换熊猫列的非数字内容

时间:2019-07-14 15:43:13

标签: python regex pandas replace

我想删除我的熊猫数据框的一列的所有非数字字符。我使用这一行:

     df.column.str.replace('[\D]', '')

当我将其应用于第一列时,我得到了第二列,但是我想要第三列:

Column                               Column after Replace        Desired output
330301 = 330324                      330301330324                330301330324

330381                               NaN                         330381

355047                               NaN                         355047

ALL 380307 / 380343                  380307380343                380307380343

第一行和最后一行是预期的输出,但是我不想删除其他值。我不明白为什么要这么做。

1 个答案:

答案 0 :(得分:0)

尝试一下:

pattern = re.compile('\D')
df[0].replace(pattern, '')

enter image description here