提取列中的子字符串,该列由Pandas中的两个特定字符分隔

时间:2018-03-27 05:18:50

标签: python pandas dataframe

我有一个包含“Wage”列的数据框,我想提取数字,因为这个列包含这样的格式:'€123K' 所以我只想保留两个字符 K 之间的数字串,以便我得到一个只包含数字的新列“Wage2”。

1 个答案:

答案 0 :(得分:0)

我认为需要extract,如果所有值都是整数,则可以astype转换:

df = pd.DataFrame({'Wage':['€123K', '€723K']})

df['Wage2'] = df['Wage'].str.extract('€(.*?)K', expand=False).astype(int)
print (df)
    Wage  Wage2
0  €123K    123
1  €723K    723