如何从GET http请求中提取url

时间:2016-02-22 13:53:30

标签: python http

所以我通过以下方式获取HTTP GET请求中的数据:

GET http://google.com/ HTTP/1.1
Host: google.com
Proxy-Connection: keep-alive
Cache-Control: max-age=0
etc etc

我想提取GET旁边的网址并将其存储在一个变量中。通过网络上的一些内容查看,但无法找到一种可靠的方法。有人有任何建议吗?

1 个答案:

答案 0 :(得分:0)

使用regexp:

import re

url_pattern = re.compile("^GET (.*)[ ].*")
line = "GET http://google.com/ HTTP/1.1"
url = url_pattern.match(line).group(1)

如果您确定网址中没有空格:-D