MS Word / OpenXML:提取语法和拼写错误

时间:2018-05-14 07:00:48

标签: vba ms-word openxml spell-checking

InOpenXML其中w:proofErr element可以是拼写类型(属性w:type="spellStart"w:type="spellEnd")或语法类型(属性w:type="gramStart"w:type="gramEnd")。当我创建一个小的测试文档(只有一个有两个错误的句子)时,我需要提取文档的错误(两种类型),信息确实在.docx XML文件中,但是当我保存整个文本时我需要处理(一个5MB的文件),这个信息没有包含在.docx文件中(可能Word认为在大型文档中这会在XML数据中产生太大的噪音)。

即使在大文件中,如何提取此信息?

是否有某种方法可以强制MS Word将信息包含在.docx文件中?

如果没有,是否有一些VBA脚本可以标记拼写错误和语法错误,例如,使用不同的颜色或某些特殊字符,以便信息硬编码到文件中?< / p>

这是一个例子,对于句子“孩子们在guarden中扮演”(其中包含协议错误和拼写错误):

     <w:t>The children </w:t>
</w:r>
<w:proofErr w:type="gramStart"/>
<w:r w:rsidRPr="008E17B0">
    <w:rPr><w:lang w:val="en-US"/></w:rPr>
    <w:t>plays</w:t>
</w:r>
<w:proofErr w:type="gramEnd"/>
<w:r w:rsidRPr="008E17B0">
    <w:rPr><w:lang w:val="en-US"/></w:rPr>
    <w:t xml:space="preserve"> in the </w:t>
</w:r>
<w:proofErr w:type="spellStart"/>
<w:r w:rsidRPr="008E17B0">
    <w:rPr><w:lang w:val="en-US"/></w:rPr>
    <w:t>guarden</w:t>
</w:r>
<w:bookmarkStart w:id="0" w:name="_GoBack"/><w:bookmarkEnd w:id="0"/> 
<w:proofErr w:type="spellEnd"/>
<w:r w:rsidRPr="008E17B0">
    <w:rPr><w:lang w:val="en-US"/></w:rPr>
    <w:t>.</w:t>
</w:r>

我想获得,例如,“孩子们在* guarden中扮演◀*”

0 个答案:

没有答案