抓取网页以获取特定类别的链接

时间:2017-06-11 15:34:39

标签: hyperlink beautifulsoup scrape

首先在这里发帖,我看了看但找不到我需要的答案。

我正在尝试通过一个网站找到所有具有某个类的链接,在本例中为“annmt”。

我希望结果只显示链接,但我在尝试使格式正确时遇到问题。一旦正确,我想把它附加到一个我可以稍后调用的空列表中。

我的代码是:

    import requests
    from bs4 import BeautifulSoup
    import datetime as dt

    l = []

    def getlinks():
        page = requests.get("http://www.investegate.co.uk/Index.aspx?
        ftse=1&date=20170609")
        soup = BeautifulSoup(page.content, 'html.parser')
        for links in soup.find_all('a', attrs={'class': 'annmt'}):
            for link in links.find_all('a', href=True):
                link = link['href']
                l.append(link)
        print l

1 个答案:

答案 0 :(得分:0)

以下是供您参考的工作代码:

import requests
from bs4 import BeautifulSoup
import datetime as dt

l = []

def getlinks():
    page = requests.get("http://www.investegate.co.uk/Index.aspx?ftse=1&date=20170609")
    soup = BeautifulSoup(page.content, 'html.parser')

    for links in soup.find_all('a', attrs={'class': 'annmt'}):
        link = links.get('href')
        l.append(link)
    print l