我的一个pandas数据帧列包含此类u'asd,abc,tre,der34,whatever'
的unicodes。最终结果应该是一列字符串列表:['asd','abc','tre','der34','whatever']
。也可以使用unicodes列表:[u'asd',u'abc',u'tre',u'der34',u'whatever']
。
顺便说一句,tt可能发生在unicodes列中有一个nan或u''。
有什么建议吗?我知道我可以做str(df['column'].iloc[0]).split(',')
并手动添加新列或做一些比较棘手的事情,但我正在寻找更多的pythonic。
答案 0 :(得分:3)
此解决方案似乎有效:
df['Column'] =df['Column'].astype(str).str.split(',')
答案 1 :(得分:0)
这应该有效,如果有你需要处理的纳米或空字符串,不管你认为合适。
In [1]: [str(col) for col in u'asd,abc,tre,der34,whatever'.split(',')]
Out[1]: ['asd', 'abc', 'tre', 'der34', 'whatever']