打印所有网址 - python

时间:2018-02-20 04:11:36

标签: python url hyperlink

我已经创建了一个get_url函数来检索一个url,我现在正试图调用该函数来定义一个不同的函数print_all_links,它打印输入字符串中的所有url。这是我到目前为止,它打印正确数量的网址,但它们只是重复的第一个网址,而不是一行,请帮助

<head>

示例输入: print_all_links('伊利诺伊大学芝加哥分校 |

打印:https://uic.edu         https://uic.edu

1 个答案:

答案 0 :(得分:0)

试试这个

def get_url(s):
    #s = s.replace(" ", "")
    b = s.find('<a href=')
    if b != -1:
        return s[b + 9 : b + 9 + s[b + 9::].find('"')]
    else:
        return b

#prints all URls in HTML input
def print_all_links(s):
    i = s.count('<a href=')
    print(i)
    n = i
    x = ''
    while n > 0:
        x = get_url(s)
        print(x)
        s = s.replace('<a href="' + x, '')
        n = n-1