如何通过编程方式将.doc转换为.html文件?

时间:2013-04-02 10:39:06

标签: c# .doc

我想在C#中将.doc转换为.htm。如果我使用Microsoft.Office.Interop.Word,我会得到例外:

  

使用CLSID检索组件的COM类工厂   {000209FF-0000-0000-C000-000000000046}由于以下原因而失败   错误:80040154未注册类(HRESULT异常:   0x80040154(REGDB_E_CLASSNOTREG))

任何解决方案?

[可能副本是:C# convert .doc to .htm,但它无法解决我的问题。]

2 个答案:

答案 0 :(得分:1)

您可以使用第三方dll读取doc / docx文件,然后使用HtmlTextWriter将数据写入html格式

查看此stackoverflow问题:

Convert word to pdf using free third party dll

Reading doc and docx files using C# without having MS Office installed on server

上述问题中提供的链接是:

for docx:

http://docx.codeplex.com/

http://msdn.microsoft.com/en-us/library/bb656295%28office.12%29.aspx

for doc:

http://npoi.codeplex.com/

答案 1 :(得分:0)

对象的CLSID {000209FF-0000-0000-C000-000000000046}需要在注册表中。

互操作程序集是使用MS Office提供的COM dll的包装程序。所以在某些层你使用COM,虽然它对你来说是透明的。

请检查您是否安装了MS Office的互操作资料。请参阅此链接http://msdn.microsoft.com/en-us/library/aa159923%28office.11%29.aspx 您可以检查是否安装了MS Word的互操作程序集。