无法将.doc保存为.xml

时间:2009-10-19 14:29:08

标签: xml ms-word doc

我想要实现的是在将.doc或.rtf文件另存为.xml时强制MS Word不拆分特定字符串。 例如,现在来自:

 Something: ***TABLE_NAME.COLUMN_NAME***

 Something: AAATABLE_NAME.COLUMN_NAMEBBB

或我得到的任何类似内容:

<w:p wsp:rsidR="00537583" wsp:rsidRDefault="00AF6BDF" wsp:rsidP="00537583">
    <w:pPr>
        <w:pStyle w:val="Default"/>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
    </w:pPr>
    <w:r>
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
        <w:t>Something: AAA</w:t>
    </w:r>
    <w:r wsp:rsidR="00537583">
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
        <w:t>TABLE_NAME.</w:t>
    </w:r>
    <w:r wsp:rsidR="00537583" wsp:rsidRPr="00537583">
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
        <w:t> COLUMN_NAME</w:t>
    </w:r>
    <w:r wsp:rsidR="00537583">
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
        <w:t>BBB</w:t>
    </w:r>
</w:p>

我想得到的是例如:

 <w:p wsp:rsidR="00537583" wsp:rsidRDefault="00AF6BDF" wsp:rsidP="00537583">
    <w:pPr>
        <w:pStyle w:val="Default"/>
        <w:jc w:val="both"/>
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
    </w:pPr>
    <w:r>
        <w:rPr>
            <w:sz w:val="23"/>
            <w:sz-cs w:val="23"/>
        </w:rPr>
        <w:t>Something: AAATABLE_NAME.COLUMN_NAMEBBB</w:t>
    </w:r>
</w:p>

对于任何有助于绕过这一点的想法,我将不胜感激。

2 个答案:

答案 0 :(得分:3)

如果您不能直接导出它,可以考虑两个选项:

  1. 使用VSTO(Link here

  2. 创建插件
  3. 创建XSLT Template以适当重新格式化XML

答案 1 :(得分:2)

Word可以选择控制随文档保存的RSID条目。这是一个只能通过Word对象模型访问的隐藏应用程序选项。

为了防止生成这些ID,您可以例如打开宏编辑器(Alt + F11)并在即时窗口中执行以下代码:

Application.Options.StoreRSIDOnSave = False

如果没有RSID,所有具有相同格式的文本都将包含在一次运行中(我认为这是您想要的)。

Word使用RSID automatically merge documents;它们不包含保留文档布局所需的基本信息,因此保存是可选的(除非您需要能够合并文档)。