熊猫:在列中查找子字符串

时间:2016-10-04 21:20:46

标签: python regex pandas

我需要在数据框中找到一些字符串

url
003.ru/*/mobilnyj_telefon_bq_phoenix*
003.ru/*/mobilnyj_telefon_fly_*
003.ru/*mobile*
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony/%brands%5D%5Bbr_23%
1click.ru/*iphone*
1click.ru/catalogue/chasy-motorola

下一个问题:当我使用

df_update = df[df['url'].str.contains(substr.url)]

它返回错误,因为有些url包含*。 我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

尝试:

df[df['url'].str.contains(substr.url, regex=False)]

您必须指定是否要将模式解释为正则表达式或普通字符串。在这种情况下,您希望将regex参数设置为False,因为默认情况下它设置为True。这样,模式中的星号不会被解释为正则表达式。

我希望这会有所帮助。