阻止python替换错误的文本

时间:2019-06-16 05:04:18

标签: python pandas beautifulsoup

我正在尝试正确结束.mp3链接,但同时也阻止替换功能替换链接的错误部分,这显然会导致其无法正常工作。

data = pd.read_csv("output9.csv")

replacements = {'.mp3':'.mp3"'',} #works fine

但是通过插入“

https://dts.podtrac.com/redirect.mp3"/dovetail.prxu.org/criminal/85cd4e4d-fa8b-4df2-8a8c-78ad0e800574/Episode_116_190504_audition_mix_neg18_part_1.mp3

我如何将第二行设置为排除项?任何帮助将不胜感激

1 个答案:

答案 0 :(得分:1)

如果我对您的理解正确,则可以分两个步骤进行操作;重要的是-没有正则表达式;进行搜索,您会发现,在处理html时,应尽可能避免使用正则表达式:

Provider

输出:

  

'https://dts.podtrac.com/redirect.mp3/dovetail.prxu.org/criminal/85cd4e4d-fa8b-4df2-8a8c-78ad0e800574/Episode_116_190504_audition_mix_neg18_part_1.mp3“'