这是我的问题:我的组织想要将用户的word文档上传到服务器。在服务器端,word文档(使用样式强制执行)需要转换为XML格式文件。接下来,我需要使用php来解析打开的xml格式文件并将内容放入数据库。有谁知道如何在服务器端自动将单词转换为XML?是否有任何API或示例代码用于解析Open XML格式?您的建议表示赞赏。
答案 0 :(得分:1)
您是否看过使用VBA?
我必须做类似的工作,我在WSF或VBS文件中使用了VBA。如果您的服务器是Windows环境,它将直接从操作系统运行。您可以从PHP(不推荐)执行此操作,或将Docx文件放入Web服务器环境之外的热文件夹中。我推荐后者,因为Web服务器环境。可以引入安全问题。
另外需要注意的是,如果要将内容与样式分开,则需要对输出标记执行一些后处理。 Word是一个“字”处理器,所以样式是它的设计目的。如果这是一项要求,我建议转而使用基于XML的结构化创作工具。
希望这有帮助!