使用split()清理带有恶意元素的数据帧

时间:2018-12-17 08:29:01

标签: python pandas split data-analysis attributeerror

在excel工作表中提供以下数据(作为数据框输入):

    Name  Number       Date
    AA    '9988779911' '01-JAN-18'
    'BB'  '8779912044' '01-FEB-18'

我已经使用以下代码来清理数据帧并删除不必要的撇号;

for name in list(df):
    df[name] = df[name].str.split("'").str[1]

我想要以下输出:

    Name  Number       Date
    AA    9988779911   01-JAN-18
    BB    8779912044   01-FEB-18

我收到以下错误: AttributeError:只能将.str访问器与字符串值一起使用,后者在熊猫中使用np.object_ dtype

在此先感谢您的帮助。:):)

3 个答案:

答案 0 :(得分:0)

尝试一下

for name in list(df):
    df[name] = df[name].str.replace("\'","")

'字符替换empty

答案 1 :(得分:0)

更简单的方法

df.applymap(lambda x: x.replace("'",""))

答案 2 :(得分:0)

Strip函数可能是这里最短的方法。其他答案也很优雅。

    str.strip("'")

Moshevi在其中一项评论中也说了同样的话。