python pandas数据帧中的列可以是列表还是集合,还是...?

时间:2019-03-02 08:16:37

标签: pandas dataframe

所有内容都在标题中:python pandas数据帧中的一列可以是列表,集合,元组还是...?

 import pandas as pd

    lnks = [ ( 'a' , 'b') , ( 'b' , 'c') , ( 'c' , 'a' ) , ('b' , 'd' ) , ( 'd' , 'a' ) ]

    lbls = [ 'x' , 'y']

    df = pd.DataFrame.from_records( lnks , columns = lbls )

尝试根据第x和y列的行值构建整体类型为的新列z:

df[ 'z' ] =  { df[ 'x' ] , df[ 'y' ] }

我收到以下错误代码:

TypeError:“系列”对象是可变的,因此它们不能被散列

我想获得一个包含以下内容的数据框:

x y z

'a' 'b' { 'a  , 'b' }
'b' 'c' { 'b' , 'c' }
'c' 'a' { 'c' , 'a' }
...

感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

此:

lnks = [('a', 'b'), ('b', 'c'), ('c', 'a'), ('b', 'd'), ('d', 'a')]
lbls = ['x', 'y']

df = pd.DataFrame.from_records(lnks, columns=lbls)

df['z'] = df.apply(lambda r: ( r.x, r.y ), axis=1) #if you want a tuple

df['z'] = df.apply(lambda r: [r.x, r.y ], axis=1)  #if you want a list
print(df)

答案 1 :(得分:0)

对于元组,请使用applyaxis=1来按行进行处理:

df[ 'z' ] =  df.apply(lambda x: (x[ 'x' ] , x[ 'y' ]), axis=1)
print (df)
   x  y       z
0  a  b  (a, b)
1  b  c  (b, c)
2  c  a  (c, a)
3  b  d  (b, d)
4  d  a  (d, a)