Question

我的一个pandas数据帧列包含此类u'asd,abc,tre,der34,whatever'的unicodes。最终结果应该是一列字符串列表：['asd','abc','tre','der34','whatever']。也可以使用unicodes列表：[u'asd',u'abc',u'tre',u'der34',u'whatever']。

顺便说一句，tt可能发生在unicodes列中有一个nan或u''。

有什么建议吗？我知道我可以做str(df['column'].iloc[0]).split(',')并手动添加新列或做一些比较棘手的事情，但我正在寻找更多的pythonic。

Answer 1

此解决方案似乎有效：

df['Column'] =df['Column'].astype(str).str.split(',')

Answer 2

这应该有效，如果有你需要处理的纳米或空字符串，不管你认为合适。

In [1]: [str(col) for col in u'asd,abc,tre,der34,whatever'.split(',')]

Out[1]: ['asd', 'abc', 'tre', 'der34', 'whatever']

Pandas，将unicodes列转换为字符串列表的列

2 个答案: