在使用gzip文件时,我面临着这个非常奇怪的问题。我正在尝试下载此文件https://www.sec.gov/Archives/edgar/daily-index/2014/QTR2/master.20140402.idx.gz
当我查看存档中文件的内容时,它是完美的。
但是,当我解压缩内容并尝试查看它们时,这些东西简直是胡言乱语。
文件有问题吗?或者我在这里看不到任何东西?
答案 0 :(得分:1)
如果我没记错的话,idx文件是Java文件。在这种情况下,它也可以是纯文本存档格式。
在Linux上,尝试运行
gunzip master.20140402.idx.gz
这会将其提取到一个idx文件中,您应该可以使用任何文本阅读器(例如vi)打开该文件,因为vi可以打开几乎所有内容。
在Windows上,您可以从命令行通过以下方式使用WinZip:
wzunzip -d master.20140402.idx.gz
然后,您可以使用IE,Edge或Wordpad等工具来尝试检查文件,这应该会自动加载可读的环境。
编辑:
因此,我下载了文件,并能够使用上述命令在vi,IE和Wordpad中解压缩并查看它,因此,如果您发现乱码,请尝试重新下载它。 .gz格式应为104kb,并提取533kb。