所有内容都在标题中:python pandas数据帧中的一列可以是列表,集合,元组还是...?
import pandas as pd
lnks = [ ( 'a' , 'b') , ( 'b' , 'c') , ( 'c' , 'a' ) , ('b' , 'd' ) , ( 'd' , 'a' ) ]
lbls = [ 'x' , 'y']
df = pd.DataFrame.from_records( lnks , columns = lbls )
尝试根据第x和y列的行值构建整体类型为的新列z:
df[ 'z' ] = { df[ 'x' ] , df[ 'y' ] }
我收到以下错误代码:
TypeError:“系列”对象是可变的,因此它们不能被散列
我想获得一个包含以下内容的数据框:
x y z
'a' 'b' { 'a , 'b' }
'b' 'c' { 'b' , 'c' }
'c' 'a' { 'c' , 'a' }
...
感谢您的帮助。
答案 0 :(得分:2)
此:
lnks = [('a', 'b'), ('b', 'c'), ('c', 'a'), ('b', 'd'), ('d', 'a')]
lbls = ['x', 'y']
df = pd.DataFrame.from_records(lnks, columns=lbls)
df['z'] = df.apply(lambda r: ( r.x, r.y ), axis=1) #if you want a tuple
或
df['z'] = df.apply(lambda r: [r.x, r.y ], axis=1) #if you want a list
print(df)
答案 1 :(得分:0)
对于元组,请使用apply
和axis=1
来按行进行处理:
df[ 'z' ] = df.apply(lambda x: (x[ 'x' ] , x[ 'y' ]), axis=1)
print (df)
x y z
0 a b (a, b)
1 b c (b, c)
2 c a (c, a)
3 b d (b, d)
4 d a (d, a)