如何使用python re模块解析和匹配搜索引擎url中的关键字?

时间:2012-10-11 03:02:03

标签: python regex asciiencoding

Google的例子:

http://www.google.com.co/url?sa=t&rct=j&q=pedro%20gomez%20proyecto%20en%20la%20ciudad%20de%20valledupar&source=web&cd=10&ved=0CFsQFjAJ&url=http%3A%2F%2Fwww.21molino.com%2F1410%2F8911.html

或来自Bing搜索:

http://www.bing.com/search?q=10%2F30+Sand&src=IE-SearchBox&FORM=IE8SRC

我希望使用?q=与python q=模块进行解析并匹配(?<=)?re个关键字。 如何将ascii url编码的多个参数传递给utf-8,以便可以读取?

在这里需要一些帮助,非常感谢:)

1 个答案:

答案 0 :(得分:2)

试试这个:

[?&]q=([^&#]*)

或者,更好的是:

import urlparse
pr = urlparse.urlparse(url)
qs = urlparse.parse_qs(pr.query)['q']

后者自动解码% - 逃脱。