在浏览器中将MS Word视为HTML

时间:2011-05-27 16:17:38

标签: c# asp.net html ms-word

您好 我正在开发一种小型搜索引擎的应用程序。它搜索word文档中的内容。我需要在gmail中实现“view as html”选项。当我单击指向doc的链接时,它应该在新浏览器中作为html页面打开。有没有办法实现这个目标?

我能够在iframe中打开doc这个词,但这不符合我的目的。

我的应用程序使用Asp.Net和C#。任何帮助将不胜感激。

此致

维涅什

1 个答案:

答案 0 :(得分:0)

简单,缓慢,内存密集,不可扩展,不可扩展(需要说两次)这样做的方法是使用办公室COM API加载文件并将其保存为html(或文本实际上,因为所有你想要做的就是搜索它),但我真的怀疑你可以在一个适度使用的网站上取消它。

除此之外,您将使用开源解析器或使用IFilter接口来执行此操作。我找到了后者的一个例子:http://www.neowin.net/forum/topic/316480-reading-text-from-ms-word-files-in-c