从PDF转换的XBRL文件中提取数据

时间:2018-11-01 07:23:01

标签: xbrl

我有一些XBRL文件转换为pdf。现在,我想开发一个项目,该项目将自动从这些文件中提取所有数据。该项目将在JAVA中开发。我无法取得任何领先。我们将不胜感激有关如何启动该项目的任何建议,因为互联网上有关此方面的信息非常有限。

1 个答案:

答案 0 :(得分:1)

我建议尝试获取原始XBRL(或iXBRL)文件,而不要使用生成的PDF。

XBRL的设计首先是为了易于机读,并且避免对印刷文档或PDF进行反向工程。尝试阅读PDF意味着不充分利用XBRL的潜力,并可能导致不确定性和错误。

然后,如果您可以获取这些源文件,我建议您使用XBRL处理器,该处理器将为您解决所有复杂性。与使用原始XML处理器相比,这将节省大量时间。可能有为Java编写的XBRL库。

很抱歉无法为您提供更好的答案,但是希望这可以帮助您入门。