在熊猫的正则表达式中使用变量str.contains()

时间:2018-12-04 22:02:23

标签: python regex pandas contains

我正尝试使用pandas str.contains()函数和包含如下所示变量的正则表达式从数据框中选择行。

df = pd.DataFrame(["A test Case","Another Testing Case"], columns=list("A"))
variable = "test"
df[df["A"].str.contains(r'\b' + variable + '\b', regex=True, case=False)] #Returns nothing

以上内容未返回任何内容,但以下内容则返回了预期的相应行

df[df["A"].str.contains(r'\btest\b', regex=True, case=False)] #Returns values as expected

任何帮助将不胜感激。

3 个答案:

答案 0 :(得分:4)

两个单词边界字符都必须在原始字符串内。为什么不使用某种字符串格式呢?通常不建议使用字符串连接。

df[df["A"].str.contains(fr'\b{variable}\b', regex=True, case=False)] 
# Or, 
# df[df["A"].str.contains(r'\b{}\b'.format(variable), regex=True, case=False)] 

             A
0  A test Case

答案 1 :(得分:0)

将“变量”解析为str.contains(variable)时,我遇到了完全相同的问题。

尝试使用str.contains(variable,regex = False)

对我来说很完美。

答案 2 :(得分:0)

以下命令对我有用:
df.query('text.str.contains(@variable)')