Question

我需要在数据框中找到一些字符串

url
003.ru/*/mobilnyj_telefon_bq_phoenix*
003.ru/*/mobilnyj_telefon_fly_*
003.ru/*mobile*
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony
003.ru/telefony_i_smartfony/mobilnye_telefony_smartfony/%brands%5D%5Bbr_23%
1click.ru/*iphone*
1click.ru/catalogue/chasy-motorola

下一个问题：当我使用

时

df_update = df[df['url'].str.contains(substr.url)]

它返回错误，因为有些url包含*。我该如何解决这个问题？

Answer 1

尝试：

df[df['url'].str.contains(substr.url, regex=False)]

您必须指定是否要将模式解释为正则表达式或普通字符串。在这种情况下，您希望将regex参数设置为False，因为默认情况下它设置为True。这样，模式中的星号不会被解释为正则表达式。

我希望这会有所帮助。

熊猫：在列中查找子字符串

1 个答案: