我需要创建一个新列,其值取决于现有列是否包含已定义的字符串:
例如
df = pd.DataFrame([['USDCAD exotic option',-100],['USDSGD vanilla option',-20]])
我想根据第一列中的字符串创建一个第三列,简单说明香草或异国情调
答案 0 :(得分:0)
使用正则表达式模式匹配从第一列中提取:
import pandas as pd
df = pd.DataFrame([['USDCAD exotic option',-100],['USDSGD vanilla option',-20]])
df["what"] = df[0].str.extract(r"USD.* (.*) option")
print(df)
输出:
0 1 what
0 USDCAD exotic option -100 exotic
1 USDSGD vanilla option -20 vanilla