从SEC下载Excel文件

时间:2015-04-20 21:55:33

标签: financial data-extraction xbrl

有没有办法从EDGAR中的Interactive Data网页自动下载excel文件以获取代码列表,而无需在EDGAR上手动搜索每个代码?或者有没有办法让一系列公司获得XBRL,而无需再次实际访问EDGAR中的每个页面?我遇到了麻烦,因为我无法弄清楚如何生成一个唯一的URL,因为最后六个数字与该年度的归档序列和帐号有关。

1 个答案:

答案 0 :(得分:0)

埃德加没有API。我写了一个包,作为Edgar的接口,允许通过代码搜索。解析搜索结果页面的位如下所示。整个文件位于https://github.com/andrewkittredge/financial_fundamentals/blob/master/financial_fundamentals/edgar.py

SEARCH_URL = ('http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&'
          'CIK={symbol}&type={filing_type}&dateb=&owner=exclude&count=100')
def _get_document_page_urls(symbol, filing_type):
    '''Get the edgar filing document pages for the CIK.

    '''
    search_url = SEARCH_URL.format(symbol=symbol, filing_type=filing_type)
    search_results_page = get_edgar_soup(url=search_url)
    xbrl_rows = [row for row in 
             search_results_page.findAll('tr') if 
             row.find(text=re.compile('Interactive Data'))]
    for xbrl_row in xbrl_rows:
        documents_page = xbrl_row.find('a', {'id' : 'documentsbutton'})['href']
        documents_url = 'http://sec.gov' + documents_page
        yield documents_url