使用正则表达式替换Pandas中的整个列。

时间:2018-12-21 16:46:33

标签: python pandas

首先,我浏览了有关此主题的其他问题,所有这些问题都不适合我的情况,或者我只是不理解它们。我在熊猫中有一个大约8列的数据框。第八列是我要使用正则表达式从该列的每个元素中提取特定部分的列。我看到的执行此操作的代码如下:

new[8].replace(r'.*', r'Name=.*;', inplace=True, regex=True)

因此,我认为在这段代码中,第一部分是您要替换的模式(这就是为什么我使用。*表达式来匹配所有内容的原因。”我认为第二部分是您要提取的模式(就我而言,我想使用Name =。*;正则表达式模式。)最终发生的事情是,它只是将列中的所有内容完全替换为我提供的第二个文本。

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:3)

在这种情况下,您可能不需要正则表达式,请尝试

new[8] = 'Name=' + new[8].astype(str)