我有一只熊猫df:
a b c
0 'k' 2 4
1 'l' 3 7
2 'm' 0 -3
3 'n' 4 4
我有一个词典: {' k':' kilo', ' l':' lima', ' m':'迈克', ' n':' 11月'}
如何在df中的这些键中创建一个新列:
a b c new
0 'k' 2 4 'kilo'
1 'l' 3 7 'lima'
2 'm' 0 -3 'mike'
3 'n' 4 4 'november'
谢谢。
答案 0 :(得分:5)
只需调用map
并传递dict,这将根据dict中的值执行系列值的查找,这是矢量化的,并且比在循环中执行此操作要快得多:
In [26]:
t = {'k': 'kilo', 'l': 'lima', 'm': 'mike', 'n': 'november'}
df['new'] = df['a'].map(t)
df
Out[26]:
a b c new
0 k 2 4 kilo
1 l 3 7 lima
2 m 0 -3 mike
3 n 4 4 november
我注意到在您的数据中,您的数据周围都有引号,在这种情况下上面的内容不会起作用,因为您的dict键只是一个字符,因此您需要使用引号来定义您的dict钥匙:
In [28]:
t = {"'k'": 'kilo', "'l'": 'lima', "'m'": 'mike', "'n'": 'november'}
df['new'] = df['a'].map(t)
df
Out[28]:
a b c new
0 'k' 2 4 kilo
1 'l' 3 7 lima
2 'm' 0 -3 mike
3 'n' 4 4 november
但是,如果没有必要,我会删除引号:
In [30]:
df['a'] = df['a'].str.replace("'", '')
df['a']
Out[30]:
0 k
1 l
2 m
3 n
Name: a, dtype: object