我一直在尝试使用R中的XBRL软件包来隔离来自sec网站的损益表,资产负债表和现金流量数据。理想情况下,我会将这三个输入到单独的数据框中,希望将数据导出到优秀的产品。
我可以使用以下命令打印R控制台中的语句:
inst <- "http://www.sec.gov/Archives/edgar/data/1223389/000122338914000023/conn-20141031.xml"
options(stringsAsFactors = FALSE)
xbrl.vars <- xbrlDoAll(inst)
xbrl.sec <- xbrlSECdev01(xbrl.vars)
xbrl.sec$showStatements()
但我无法创建数据框来保存所有这些信息。
到目前为止,我已经尝试过了:
conn.data <- xbrl.sec$showStatements()
不幸的是,这只会再次输出数据并使conn.data
为空。
知道如何存储这些数据吗?
“How to take the lists created by xbrlDoAll in the XBRL package in R, and organize them into dataframes readable in Excel?”在去年三月被问及未得到答复。
答案 0 :(得分:3)
XBRL 包是复杂XBRL文件(XML,模式,XLink,...)的解析器。结果很简单:数据框列表。但它仍然需要对XBRL理念有所了解。
您将在fact
表中找到所有数字。加入context
即可获得期限和具体尺寸。要了解它们所代表的会计概念(现金,库存,流动资产等),您还必须加入element
表。
元素通常由3个链接库进行分层排列:计算,表示和定义。链接库使用from-element和to-element字段来定义层次结构,使用rule
来分隔不同的视图。财务报表通常在演示链接库中描述。
最后 - 使用label
表来查找概念名称和描述(它们直接从元素链接,但可能有更多的标签类型和语言)。
整个事情或多或少是以正确的顺序加入表格的练习,因此 dplyr 非常方便。您可以在github上看到我对样本SEC文件的困难。