访问office 2003文件

时间:2012-04-05 09:30:23

标签: c# c++ .net extraction office-2003

我想访问office 2003文件(.doc,.xls和.ppt)以提取文本和一些元数据(单词数量,页数,图片,模板等)。我可以使用Open XML SDK for Office 2007文档。但是,此提取将在服务器上进行,该服务器不能安装Microsoft Office等应用程序(这就是我无法使用Office的Interop的原因)。 我尝试过NPOI,但实际上它只支持.xls文件。我找到的其他库不是开源的,我不能在我的工作中使用它...我下载了NPOI Scratchpad,但代码非常“原始”,我不能在我的工作中使用它。 您是否有任何其他想法从office 2003文档中获取文本和元数据?我不是一个非常有经验的程序员,而且我正在使用C#(但是,如果在C ++中有任何解决这个问题的方法,我可以考虑使用它)。感谢。

1 个答案:

答案 0 :(得分:1)

有许多图书馆,如:

  • ClosedXML(Office 2007)
  • EPPlus(Office 2007)
  • Aspose cells(Office 97-2010,我用这个)

我不知道任何支持office 2003格式的免费图书馆。

祝你好运