使用BeautifulSoup下载多个动态网页

时间:2011-05-02 14:54:17

标签: python

我正试图找到一种方法来下载多个看起来像这样的网页: https://domain.index.aspx?place=&time=123

如何下​​载以三位数字结尾的每个页面? 我试过https://domain.index.aspx?place=&time=+[0-9]'\d{3}但两者都不起作用。

感谢

1 个答案:

答案 0 :(得分:1)

您必须知道要下载和执行的不同页面的结束编号,例如:

for numb in ('458', '123', '453'):
    sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + numb)

或者如果您想尝试所有3位数的数字:

for numb in xrange(0,1000):
   sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + str(numb).zfill(3))