我使用了“提取”命令,但它无法找到与我正在处理的这些excel电子表格中找到的FOCA一样多的信息。
例如,我正在使用FOCA应用程序从Web收集和下载文件。之后,它从所有文件中提取元数据。
对于excel文件,似乎这些文件包含的元数据多于普通的pdf文件。话虽这么说,FOCA能够检测打印机名称,电子邮件地址以及存储在此电子表格文件中的一些其他内容。但是,我找不到任何方法在Linux中使用“extract”命令获取相同的信息。
任何人都知道在Linux中提取文件并获取其所有元数据的方法吗?似乎提取命令可能受限于我的理解。
谢谢,
答案 0 :(得分:0)
Excel文件在文件中存储了大量元数据,因此您必须解析文件本身才能获得它。由于您使用的是Linux并且无法使用Excel互操作,因此您可以尝试使用ExcelWriter之类的Excel库或类似的东西。 ExcelWriter是为.Net编写的,因此您必须使用mono。