客户拥有大型文档管理系统 - 数百万个TIFF和PDF以及更少的其他随机文件;图像和其他二进制文件。我正在转换格式,印记笔记,重新组织和编辑敏感信息。这对于大量文件来说都很棒。
但我偶尔会找到一种新格式,并且必须弄清楚它是什么以及如何在项目参数中处理它。通常情况下这并不太难,如果我只是无法处理它,那么它就是如此之少,以至于它无关紧要。但是现在,我有一些文件似乎没有复杂的标题,但都以“COM1.0”(43 4F 4D 31 2E 30)开头。
所以,我想在两个层面上提供帮助。对我来说研究这个问题的好方法(以及我将来可能会发现的其他方法 - 教一个人钓鱼,以及所有);什么时候谷歌搜索失败了我?如果您知道文件类型是什么,我会热衷于听到它。
答案 0 :(得分:4)
一个专家网站是http://www.wotsit.org/ - 可能还有其他一些网站。但是,当您已经可以识别文件格式时,它们会提供详细信息。
http://www.garykessler.net/library/file_sigs.html
还有一些提示我确实尝试过做一些搜索,但没有发现任何事情,但我并没有非常努力。
答案 1 :(得分:4)
祝你好运,但请记住,并非所有文件格式都在创建它的公司之外记录;并且,很少有公司在发布之前发布他们的文件格式。
根据这些文件的年龄,除非你有一些额外的提示可以使用(比如与文件相关联的程序的名称),否则击中砖墙的几率很高。
答案 2 :(得分:0)