在数据框列中搜索字符串

时间:2020-06-09 12:31:34

标签: python-3.x pandas

我需要创建一个新列,其值取决于现有列是否包含已定义的字符串:

例如

df =  pd.DataFrame([['USDCAD exotic option',-100],['USDSGD vanilla option',-20]])

我想根据第一列中的字符串创建一个第三列,简单说明香草或异国情调

1 个答案:

答案 0 :(得分:0)

使用正则表达式模式匹配从第一列中提取:

import pandas as pd 

df = pd.DataFrame([['USDCAD exotic option',-100],['USDSGD vanilla option',-20]])

df["what"] = df[0].str.extract(r"USD.* (.*) option")

print(df)

输出:

                       0    1     what
0   USDCAD exotic option -100   exotic
1  USDSGD vanilla option  -20  vanilla