Python urllib模块:迭代URL

时间:2017-07-26 02:03:47

标签: python urllib

我正在尝试从页面的html文本中获取最后5个字符,并使用它们替换url中的最后5个字符,然后重试。我需要多次重复这个。

这就是我想出来的。目前,它连续5次打印相同的URL。

~/.xmonad/xmonad.hs

1 个答案:

答案 0 :(得分:0)

我不明白为什么会出现负面影响。我可以用一些建设性的批评来代替。鼓励学习的好方法。

无论如何,我想我已经明白了。它需要一些额外的步骤,但是按照我想要的方式工作。

import urllib.request

prevurl = "http://www.pythonchallenge.com/pc/def/linkedlist.php?nothing=12345"
for i in range(1,400):
    with urllib.request.urlopen(prevurl) as url:
        s = url.read().decode("utf-8")
        n1 = []
        u1 = []
        for i in s:
            if i.isdigit():
                n1.append(i)
                n2 = ''.join(n1)
        for i in prevurl:
            if i.isdigit():
                u1.append(i)
                u2 = ''.join(u1)
        if len(n2) != len(u2):
            prevurl = prevurl.replace(prevurl[-(len(u2)):], n2)
        else:
            prevurl = prevurl.replace(prevurl[-(len(n2)):],n2)

    print(prevurl)