我有一个包含“Wage”列的数据框,我想提取数字,因为这个列包含这样的格式:'€123K' 所以我只想保留两个字符€和 K 之间的数字串,以便我得到一个只包含数字的新列“Wage2”。
答案 0 :(得分:0)
我认为需要extract
,如果所有值都是整数,则可以astype
转换:
df = pd.DataFrame({'Wage':['€123K', '€723K']})
df['Wage2'] = df['Wage'].str.extract('€(.*?)K', expand=False).astype(int)
print (df)
Wage Wage2
0 €123K 123
1 €723K 723