从pandas数据帧中的现有数据创建一个新变量

时间:2013-06-29 07:31:29

标签: python dataframe pandas

我需要一些帮助才能在数据框中形成一个新变量 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这是一个例子。

>>> df
   A  B   
0  a  1  
1  b  2  
2  c  3  
3  a  5  
4  d  6  

我想在A中创建一个值为a和c的新列,并将它们命名为ac,将b和d命名为bd并将它们命名为bd 最终结果应该是这样的。将它们从A分组并在新列中为组添加新名称的类型。

>>> df
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd

/纳斯

1 个答案:

答案 0 :(得分:1)

In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')

In [5]: df['C'] = [ mapper[x] for x in df['A'] ]

In [6]: df
Out[6]: 
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd