来自MS Word插件的有意义的XML

时间:2010-01-05 11:59:10

标签: xml ms-word semantics

我需要构建一个MS Word 2007插件,该插件提供了一个按钮,当单击该按钮时,将Word文档作为XML上载到Web服务。

到目前为止,这似乎并不是那么有问题,但客户还有额外的要求,即他们希望XML有意义。它们正在记录格式化文本,但希望文档的某些区域包含在某些标记内,例如:

<WordDocument>
    <TagArea1>
        *word style xml for this bit of the document here*
    </TagArea1>
    <TagArea2>
        *word style xml for this bit of the document here*
    </TagArea2>
</WordDocument>

他们的理想是拥有模板,他们可以定义上传时创建此样式XML的部分。

使用Word而不是基于表单的技术的原因是保持格式一致非常重要,并且能够选择发生分页的位置等对他们来说至关重要。

我担心这种类型的功能可能无法实现,但我对Office应用程序内部开发非常陌生,所以我们非常感谢一些指针。

2 个答案:

答案 0 :(得分:2)

我将其作为docx(包含xml +资源的zip文件)上传,并使用System.IO.Packaging对其进行操作。我知道您可以在Word中执行表单,但我不确定它是如何在docx xml中表示的。我首先在Word中创建一个表单,使用它,将其保存为docx,然后撕掉XML以查看其中的内容。

换句话说,我会使用已经存在的设施而不是试图破解某些东西。

答案 1 :(得分:1)

您可以尝试使用链接到您自己的XML部分的内容控件(sdts)。尽管避免i4i专利混乱。请参阅Gray Knowlton post