我正在尝试使用Open XML SDK 2.5从.docx-Templates创建报告。在模板中,我定义了一些被实际值替换的占位符。占位符可以在各种模式中定义,例如
<#Name#>
or
<!#Name#!>
or
#Name#
or
{{Name}}
占位符的架构也可以采用其他格式,只要可以在文本中清楚地标识占位符。
我目前面临的问题是,占位符通常分为<w:t>
- 元素(DocumentFormat.OpenXml.Wordprocessing.Text
)中的多个<w:p>
- 元素(DocumentFormat.OpenXml.Wordprocessing.Paragraph
)。一个例子
<w:p w:rsidR="003137E0" w:rsidRDefault="008C62F1" w:rsidP="00D43D55">
<w:r>
<w:t xml:space="preserve">#FirstName# </w:t>
</w:r>
<w:r w:rsidR="00C93A70">
<w:t>#LastName</w:t>
</w:r>
<w:r w:rsidR="005F49B7">
<w:t>#</w:t>
</w:r>
</w:p>
此处占位符#FirstName#
很容易识别,因为它位于一个<w:t>
- 元素内,但占位符#LastName#
分为多个<w:t>
- 元素,因此我不能在文档上的文本上使用简单的正则表达式,如
Regex placeholderRegex = new Regex(@"#[\w]*#");
document.MainDocumentPart.Document.Body.Descendants<Text>().Where(t=> placeholderRegex.IsMatch(t.Text))
我无法控制模板的定义方式,也不会对用户如何创建模板施加约束。对我来说,当占位符被分成多个<w:t>
- 元素时,也不清楚。
使用{{[\w]*}}
作为占位符架构的另一个示例。
文字(Docx)
{{Ort}}
And this {{placeholder}} is within the text
Xml(OpenXML)
<w:document xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:wp14="http://schemas.microsoft.com/office/word/2010/wordprocessingDrawing" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main" xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml" xmlns:wpg="http://schemas.microsoft.com/office/word/2010/wordprocessingGroup" xmlns:wpi="http://schemas.microsoft.com/office/word/2010/wordprocessingInk" xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml" xmlns:wps="http://schemas.microsoft.com/office/word/2010/wordprocessingShape" mc:Ignorable="w14 wp14">
<w:body>
<w:p w:rsidR="007B60F2" w:rsidRDefault="00BB7370" w:rsidP="00D43D55">
<w:pPr>
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
</w:pPr>
<w:r w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>{{</w:t>
</w:r>
<w:r w:rsidR="00C93A70" w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>Ort</w:t>
</w:r>
<w:r w:rsidR="00114EA7" w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>}}</w:t>
</w:r>
</w:p>
<w:p w:rsidR="00EC3BED" w:rsidRPr="00114EA7" w:rsidRDefault="00C310E0" w:rsidP="00D43D55">
<w:pPr>
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
</w:pPr>
<w:r w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t xml:space="preserve">This is a text with a </w:t>
</w:r>
<w:r w:rsidR="00A07A5D">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>{{</w:t>
</w:r>
<w:r w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>placeholder</w:t>
</w:r>
<w:r w:rsidR="00A07A5D">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>}</w:t>
</w:r>
<w:r w:rsidR="00114EA7" w:rsidRPr="00114EA7">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>}</w:t>
</w:r>
<w:bookmarkStart w:id="0" w:name="_GoBack" />
<w:bookmarkEnd w:id="0" />
<w:r w:rsidR="00A07A5D">
<w:rPr>
<w:lang w:val="en-US" />
</w:rPr>
<w:t>.</w:t>
</w:r>
</w:p>
<w:sectPr w:rsidR="00EC3BED" w:rsidRPr="00114EA7" w:rsidSect="00237721">
<w:pgSz w:w="11906" w:h="16838" />
<w:pgMar w:top="1417" w:right="1417" w:bottom="1134" w:left="1417" w:header="708" w:footer="708" w:gutter="0" />
<w:cols w:space="708" />
<w:docGrid w:linePitch="360" />
</w:sectPr>
</w:body>
</w:document>
所以我现在的问题是使用Open XML SDK搜索和替换占位符的方法是什么? SDK中是否有一些功能可以帮助我?有没有人解决这个问题并提供帮助?
答案 0 :(得分:3)
请参阅docx4j does not replace variables以获取解决问题的Java源代码链接。
您可以在C#中实现类似的功能,或通过http://www.nuget.org/packages/docx4j.NET/3.0.1
使用该代码答案 1 :(得分:1)
是的,MS Word应用程序甚至将单个单词拆分为多个Run / Text元素(由于某种原因)。不,Open XML SDK功能中没有提供查找/替换功能。但是你可以为最简单的段落/运行/文本结构创建自己的。你需要:
答案 2 :(得分:1)
我会用这样的东西做这件事(没有经过测试,但我认为这会对你有帮助):
列出placeHolders = new List();
//load xml string
var doc = XDocument.Parse(xml);
//or to load from file use XDocument.Load("path_to_xml_file.xml");
//get all <w:p> element
var wpElements = doc.Root.Elements("w:p");
foreach (var wp in wpElements)
{
var wrElements = wp.Descendants("w:r");
foreach (var wr in wrElements)
{
var wt = (string)wr.Element("w:t");
if (wt.IsMatch(@"\w")) { //add the string to placeHolders if word is found
placeHolders.Add(wt);
}
else
{
//if not found a word, add it to the last placeHolder,
placeHolder[placeHolder.Count - 1] = placeHolder[placeHolder.Count - 1] + wt;
}
}
}