我也是Python和编程的新手。 让我首先解释一下我尝试使用下面的代码完成的任务,然后我将解释我遇到的问题。
该程序的目的是从EDGAR数据库中提取10-k文件的URL。 10-k文件基本上是上市公司的年度报告。
tk_sr_3q是我之前创建的一个python文件,其中包含一个包含大约10万个元素的列表。所有元素都是EDGAR数据库中10-k文件的搜索结果的URL。
例如:
有些公司有很多10-k文件,有些有几个,有些则没有。我想从每个公司获得不超过六个10-k文件URL,然后以列表格式在文本文件中写入它们。
当我运行程序时,它没有完成。但它产生的文本文件包含大约三千个元素,如果它正确运行则不可能。
非常感谢您阅读我的问题。
import tk_sr_3q
tkfd_url_list_file = open('tkfd_url_list.txt', 'w')
for url in tk_sr_3q.list:
tk_sr_src = requests.get(url)
tk_sr_src_soup = BeautifulSoup(tk_sr_src.content)
fd_link_list = tk_sr_src_soup.find_all('a', {'id': 'documentsbutton'}, limit=6)
for link in fd_link_list:
tkfd_url = 'http://www.sec.gov'+link['href']
tkfd_url_list_file.write("%s" % "'"+tkfd_url+"'"+',')
tkfd_url_list_file.close()