熊猫数据框具有正则表达式关键字

时间:2018-11-29 23:33:19

标签: pandas

我有一个包含关键字列表及其对应列的df

partition_keys

文件夹路径:C:\ WCR basic \ testing \ dual,它应与column1 WCR 行值以及column2和column3的返回值匹配。 输出:键,补偿

当我遍历文件路径列表时,如果文件路径包含column1中存在的任何关键字,则它应该重新运行column2和3中的值。我不确定在这种情况下使用regex是否会带来更好的结果? / p>

1 个答案:

答案 0 :(得分:1)

IIUC,使用列表推导并搜索Column 1的每个值是否是文件夹路径的子字符串可能会更轻松:

folder_path = 'C:\\WCR basic\\testing\\dual'

>>> df.loc[[i in folder_path for i in df['Column 1']], ['Column2','Column3']]
  Column2 Column3
1     Key    Comp