使用OpenXML和C#处理word文档

时间:2015-08-18 16:11:35

标签: c# wpf openxml

所以我试图通过匹配Tag并填充该内容控件中的文本来填充word文档中的内容控件。

以下在MessageBox中显示我文档中的所有标记。

//Create a copy of the template file and open the document
File.Delete(hhscDocument);
File.Copy(hhscTemplate, hhscDocument, true);

//Open the word document specified by location
using (var document = WordprocessingDocument.Open(hhscDocument, true))
{

    //Change the document type from template to document
    var mainDocument = document.MainDocumentPart.Document;
    if (mainDocument.Body.Descendants<Tag>().Any())
    {
        //MessageBox.Show(mainDocument.Body.Descendants<Table>().Count().ToString());
        var tags = mainDocument.Body.Descendants<Tag>().ToList();
        var aString = string.Empty;
        foreach(var tag in tags)
        {
            aString += string.Format("{0}{1}", tag.Val, Environment.NewLine);
        }
        MessageBox.Show(aString);
    }
}

但是,当我尝试以下操作时,它不起作用。

//Create a copy of the template file and open the document
File.Delete(hhscDocument);
File.Copy(hhscTemplate, hhscDocument, true);

//Open the word document specified by location
using (var document = WordprocessingDocument.Open(hhscDocument, true))
{

    //Change the document type from template to document
    var mainDocument = document.MainDocumentPart.Document;
    if (mainDocument.Body.Descendants<Tag>().Any())
    {
        //MessageBox.Show(mainDocument.Body.Descendants<Table>().Count().ToString());
        var tags = mainDocument.Body.Descendants<Tag>().ToList();
        var bString = string.Empty;
        foreach(var tag in tags)
        {
            bString += string.Format("{0}{1}", tag.Parent.GetFirstChild<Text>().Text, Environment.NewLine);
        }
        MessageBox.Show(bString);
    }
}

我的目标是,如果我匹配相应的标签,我想填充/更改标签所属的内容控件中的文本。

1 个答案:

答案 0 :(得分:0)

所以我基本上使用FirstChild和InnerXml来分离文档XML内容。从那里我开发了以下功能,满足了我的需求。

//Open the word document specified by location
using (var document = WordprocessingDocument.Open(hhscDocument, true))
{       
    var mainDocument = document.MainDocumentPart.Document;
    if (mainDocument.Body.Descendants<Tag>().Any())
    {
        //Find all elements(descendants) of type tag
        var tags = mainDocument.Body.Descendants<Tag>().ToList();

        //Foreach of these tags
        foreach (var tag in tags)
        {
            //Jump up two levels (.Parent.Parent) in the XML element and then jump down to the run level
            var run = tag.Parent.Parent.Descendants<Run>().ToList();

            //I access the 1st element because there is only one element in run
            run[0].GetFirstChild<Text>().Text = "<new_text_value>";
        }
    }
    mainDocument.Save();
}

这会找到文档中的所有标记,并将这些元素存储在列表中

var tags = mainDocument.Body.Descendants<Tag>().ToList();

这部分代码从xml的标记部分开始。从那里我调用parent两次在XML代码中跳过两个级别,这样我就可以使用后代访问Run级别。

var run = tag.Parent.Parent.Descendants<Run>().ToList();

最后但并非最不重要的是,以下代码将一个新值存储到PlainText Content控件的文本部分。

run[0].GetFirstChild<Text>().Text = "<new_text_value>";

我注意到的事情是xml层次结构是一个时髦的事情。我发现从下到上更容易访问这些内容,因此我开始使用标签并向上移动。