这是我的数据框
在“封面设计”列中,很少有以“-undefined”结尾的值,我想删除该值。因此,我使用split函数删除了
test[['ttt']] = test['Cover Design'].str.split(' - undefined')
这就是我所得到的
但是新列中的值在列表类型中如何将其转换为字符串?
答案 0 :(得分:5)
您应为str[0]
更改您的解决方案,以选择split
之后的列表的第一个值:
test['ttt'] = test['Cover Design'].str.split(' - undefined').str[0]
另一种解决方案是使用Series.str.replace
:
test['ttt'] = test['Cover Design'].str.replace(' - undefined', '')
如果需要通过正则表达式$
指定字符串的结尾:
test['ttt'] = test['Cover Design'].str.replace(' - undefined$', '')
错误的解决方案是使用strip
,因为它会从字符串的开头和结尾删除- undefined
中的所有值,请不要使用它:
test['ttt'] = test['Cover Design'].str.strip(' - undefined')