我正在努力为摘要财务表刮取雅虎财务。我没有一个接一个地做,而是希望通过列表或csv文件来实现。
目前我能够刮掉多个表但是当我尝试使用df.read_html时它只给了我一张表。
有谁知道更好的方法吗?到目前为止我的代码是:
with open(ticker_list_test.csv') as f:
for ticker in map(str.strip,f):
url = "https://finance.yahoo.com/quote/{}".format(ticker)
r = requests.get(url)
soup = BeautifulSoup(r.content)
yahoo_table = soup.find_all("table", "W(100%)")
print(yahoo_table)
df = pd.read_html(str(yahoo_table))
我的ticker_list_test.cvs只有3个股票代码 - AAPL,SPY和NFLX。
感谢