我有一个网址列表,例如“www.blah.com/en-us”,我需要在“www.blah.com”之后切断任何内容。我尝试过使用以下内容:
import re
website = www.blah.com/en-us
cleanURL = re.sub('(.|\n)*?com', "", website)
输出:'en-us'
所以我得到了与我想要的相反的东西。很抱歉,如果这篇文章格式不正确,请第一时间提问。
答案 0 :(得分:4)
如何使用
website = "www.blah.com/en-us"
cleanURL = website.split("/",1)[0]
答案 1 :(得分:2)
正在使用正则表达式吗?如果您尝试处理的URL中没有协议(例如http://),您可以使用your_url_string.split('/', 1)[0]
,它应该在第一个“/”实例上拆分,并在拆分前为您提供部分