Pandas,将unicodes列转换为字符串列表的列

时间:2014-08-07 10:55:06

标签: python string unicode pandas type-conversion

我的一个pandas数据帧列包含此类u'asd,abc,tre,der34,whatever'的unicodes。最终结果应该是一列字符串列表:['asd','abc','tre','der34','whatever']。也可以使用unicodes列表:[u'asd',u'abc',u'tre',u'der34',u'whatever']

顺便说一句,tt可能发生在unicodes列中有一个nan或u''。

有什么建议吗?我知道我可以做str(df['column'].iloc[0]).split(',')并手动添加新列或做一些比较棘手的事情,但我正在寻找更多的pythonic。

2 个答案:

答案 0 :(得分:3)

此解决方案似乎有效:

df['Column'] =df['Column'].astype(str).str.split(',')

答案 1 :(得分:0)

这应该有效,如果有你需要处理的纳米或空字符串,不管你认为合适。

In [1]: [str(col) for col in u'asd,abc,tre,der34,whatever'.split(',')]

Out[1]: ['asd', 'abc', 'tre', 'der34', 'whatever']