我想访问office 2003文件(.doc,.xls和.ppt)以提取文本和一些元数据(单词数量,页数,图片,模板等)。我可以使用Open XML SDK for Office 2007文档。但是,此提取将在服务器上进行,该服务器不能安装Microsoft Office等应用程序(这就是我无法使用Office的Interop的原因)。 我尝试过NPOI,但实际上它只支持.xls文件。我找到的其他库不是开源的,我不能在我的工作中使用它...我下载了NPOI Scratchpad,但代码非常“原始”,我不能在我的工作中使用它。 您是否有任何其他想法从office 2003文档中获取文本和元数据?我不是一个非常有经验的程序员,而且我正在使用C#(但是,如果在C ++中有任何解决这个问题的方法,我可以考虑使用它)。感谢。
答案 0 :(得分:1)
有许多图书馆,如:
我不知道任何支持office 2003格式的免费图书馆。
祝你好运