我需要从网页http://www.aastocks.com/tc/stocks/news/aafn/result-announcement的左下方提取新闻标题和内容(如果有)。
我的代码能够提取网页左下部分的第一部分。但是,我无法从视口(第2、3页等)外部提取数据。
新闻标题示例:
长城微光(08286.HK)首三季亏转盈赚65.2万元人民币
如何从其他页面中提取数据?
result = requests.get("http://www.aastocks.com/tc/stocks/news/aafn/result-announcement")
result.raise_for_status()
result.encoding = "utf-8"
src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup)
news = []
for a_tag in soup.find_all('a'):
news.append(a_tag.text)
df = df.append(pd.DataFrame(news, columns=['News']))
print(news)