首先在这里发帖,我看了看但找不到我需要的答案。
我正在尝试通过一个网站找到所有具有某个类的链接,在本例中为“annmt”。
我希望结果只显示链接,但我在尝试使格式正确时遇到问题。一旦正确,我想把它附加到一个我可以稍后调用的空列表中。
我的代码是:
import requests
from bs4 import BeautifulSoup
import datetime as dt
l = []
def getlinks():
page = requests.get("http://www.investegate.co.uk/Index.aspx?
ftse=1&date=20170609")
soup = BeautifulSoup(page.content, 'html.parser')
for links in soup.find_all('a', attrs={'class': 'annmt'}):
for link in links.find_all('a', href=True):
link = link['href']
l.append(link)
print l
答案 0 :(得分:0)
以下是供您参考的工作代码:
import requests
from bs4 import BeautifulSoup
import datetime as dt
l = []
def getlinks():
page = requests.get("http://www.investegate.co.uk/Index.aspx?ftse=1&date=20170609")
soup = BeautifulSoup(page.content, 'html.parser')
for links in soup.find_all('a', attrs={'class': 'annmt'}):
link = links.get('href')
l.append(link)
print l