我需要在数据框中找到一些字符串
url
003.ru/*/mobilnyj_telefon_bq_phoenix*
003.ru/*/mobilnyj_telefon_fly_*
003.ru/*mobile*
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony/%brands%5D%5Bbr_23%
1click.ru/*iphone*
1click.ru/catalogue/chasy-motorola
下一个问题:当我使用
时df_update = df[df['url'].str.contains(substr.url)]
它返回错误,因为有些url
包含*
。
我该如何解决这个问题?
答案 0 :(得分:1)
尝试:
df[df['url'].str.contains(substr.url, regex=False)]
您必须指定是否要将模式解释为正则表达式或普通字符串。在这种情况下,您希望将regex
参数设置为False
,因为默认情况下它设置为True
。这样,模式中的星号不会被解释为正则表达式。
我希望这会有所帮助。