我需要一些帮助才能在数据框中形成一个新变量 我有一个非常大的数据集,我想从另一列的现有数据中创建一个新变量。 这是一个例子。
>>> df
A B
0 a 1
1 b 2
2 c 3
3 a 5
4 d 6
我想在A中创建一个值为a和c的新列,并将它们命名为ac,将b和d命名为bd并将它们命名为bd 最终结果应该是这样的。将它们从A分组并在新列中为组添加新名称的类型。
>>> df
A B C
0 a 1 ac
1 b 2 bd
2 c 3 ac
3 a 5 ac
4 d 6 bd
/纳斯
答案 0 :(得分:1)
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')
In [5]: df['C'] = [ mapper[x] for x in df['A'] ]
In [6]: df
Out[6]:
A B C
0 a 1 ac
1 b 2 bd
2 c 3 ac
3 a 5 ac
4 d 6 bd