从Companies House的iXBRL文件中提取帐户

时间:2018-02-26 00:31:51

标签: xml xbrl

我可以从Companies House下载他们的API的iXBRL文件(.xhtml)。现在我试图从文件中提取个人财务帐户(例如现金,资产等)。

该文件是(例如https://beta.companieshouse.gov.uk/company/09781982/filing-history/MzE4MzYxMDE0MGFkaXF6a2N4/document?format=xhtml&download=1

并且似乎不是XML文件。我已经尝试过XML包,它不起作用,只带来身体和头部:

#html is the file    
xml <- xmlParse(html)
xmltop <-xmlRoot(xml) 
xmlSApply(xmltop, function(x) xmlSApply(x, xmlValue))

XBRL包也表现不佳,使用本地文件会出现编码错误并挂起

inst <- file.path("text.xhtml")
xbrl.vars <- xbrlDoAll(inst, verbose=TRUE)

非常感谢任何有关下一步移动或如何获取这些帐户的想法

0 个答案:

没有答案