在我们的项目中,我们使用HTML和MS Word进行了大量工作。用户在浏览器中创建“文档”,完成后,使用DocX库(http://docx.codeplex.com/)将这些文档导出到MS Word。当我们只处理文本时,这很好。
我们现在要做的是让用户格式化在浏览器中输入的文本。使用任何WYSIWYG浏览器编辑器都可以轻松实现。问题是我们想要采用样式化HTML并将其导出为单词。
我见过声称可以将HTML转换为RTF的商业组件,所以我想也许这可以解决它但我正在等待DocX支持RTF文本的响应。最好的解决方案是将HTML直接转换为DocX格式,但我只看到ASPOSE具有此功能,ASPOSE非常昂贵。
有谁知道如何解决这个问题?如何将HTML转换为docx文件?
谢谢!
答案 0 :(得分:0)
这有点难看(考虑到资源),但它是一个选项:Batch CommandLine FileConversion with OpenOffice。它应该能够从HTML转换 - > Doc(然后DocX可以处理)。
soffice.exe -headless -nologo -norestore -accept=socket,host=localhost,port=8100;urp;StarOffice.ServiceManager
python DocumentConverter.py test.html test.doc
答案 1 :(得分:0)
Aspose是否会花费你的时间来找到一个框架来完成你想要的,测试和部署解决方案?多年前我们使用XSLT来创建RTF文档,但Aspose已经存在,那么我会根据它保存的时间选择。