在一定数量的正斜杠之后如何删除字符串中的剩余文本?

时间:2019-07-08 15:44:05

标签: python

我正在尝试在一定数量的正斜杠之后删除字符串的其余部分。 我想要这个:

https://yeezysupply.com/17655971/checkouts/4cba9aacf4ad07b281d152fb4b51c8cc/stock_problems

要成为这个:

https://yeezysupply.com/17655971/checkouts/4cba9aacf4ad07b281d152fb4b51c8cc

我要删除第6个正斜杠之后的文本。

2 个答案:

答案 0 :(得分:0)

使用拆分和联接:

u = "https://yeezysupply.com/17655971/checkouts/4cba9aacf4ad07b281d152fb4b51c8cc/stock_problems"
u = "/".join(u.split("/")[:6])

它用/字符分隔网址,并用相同的字符将前6个字符连起来

答案 1 :(得分:0)

最简单的方法是在/上分割字符串,然后重新加入前6个部分。或者,您可以使用regular expression

import re

s = 'https://yeezysupply.com/17655971/checkouts/4cba9aacf4ad07b281d152fb4b51c8cc/stock_problems'
s = re.sub(r'((.*?/){6}).*', r'\1', s)

当然,要进行更认真的URL操作,最好使用urllib.parse之类的东西。