从txt文件中提取数据

时间:2014-04-21 17:24:30

标签: python git file-io git-bash

好的,我正在使用Git Bash中的git。在我运行它之后,我在我的硬盘上的format中有txt证券交易委员会数据库的txt个文件。我使用的是Win 7. HTML文件里面有<us-gaap:IncomeTaxExpenseBenefit contextRef="eol_PE9523----1310-K0013_STD_365_20131231_0" decimals="-3" id="id_3914012_7F3BEF88-8CD1-49E7-8A78-91A091178D1B_1_13" unitRef="iso4217_USD">40315000</us-gaap:IncomeTaxExpenseBenefit> 个标签。

我想知道,因为自九十年代初期以来,如果有一种方法可以提取某个项目,那么美国证券交易委员会的文件中的文件就是这种严格的格式了吗?

{{1}}

是否通过使用脚本或git存储库具有准确性,因为格式是严格的?例如,有人可以从txt文件中提取漏洞表吗?图书馆,gits,脚本任何有一点工作和修改的东西都可以用来开始。

这些gits能否进入并完成这样的工作?我阅读说明书(无论何时有),但我不了解很多东西。

1 个答案:

答案 0 :(得分:1)

这不是HTML。它看起来像XML - 尝试使用Python的XML解析器,例如ElementTree,并解析相关信息。该教程包含在他们的页面中。