我有一些C#代码将一个文件合并到另一个文件中。这是一个非常直接的过程:
//open the files
Microsoft.Office.Interop.Word.Document file1 = winWord.Documents.Open(ref
file1address, ReadOnly: true, Visible: false);
Microsoft.Office.Interop.Word.Document insertfile =
winWord.Documents.Open(ref insertfileaddress, ReadOnly: true,
Visible: false);
//activate file1
file1.Activate();
// insert a page break
file1.Words.Last.
InsertBreak(Microsoft.Office.Interop.Word.
WdBreakType.wdPageBreak);
//move to end and insert insertfile
Microsoft.Office.Interop.Word.Selection selection = winWord.Selection;
selection = winWord.Selection;
selection.
EndOf(Microsoft.Office.Interop.Word.WdUnits.wdStory,
Microsoft.Office.Interop.Word.WdMovementType.wdMove);
selection.InsertFile(insertfileaddress.ToString(), missing,
missing, missing, missing);
// save under a new name
file1.SaveAs2(NewFileName);
在我的项目中,我使用此代码两次。我第一次生成一个大约300页长的文件,那个时候效果很好。
第二次更大 - 结果文件长度超过15,000页 - 在这种情况下会出现问题。段落样式全部丢失 - 所有段落都是正常的。 (我关心的是标题段落维护他们的"标题1"或"标题2"或"标题3"名称。
在两种情况下,file1都是相同的,insertfile是使用word interop在别处生成的 - 生成这些文件的代码与较小和较大版本中的代码相同。文件特征和内容的特征都是一样的 - 但我失去了#34;标题"更大版本的风格。
我能想到的唯一解决方案是浏览新文件并再次应用样式。
如果有人知道为什么会这样,以及如何解决,请帮助。
答案 0 :(得分:1)
正如您在上面的评论中所看到的,我尝试了几件事。一个有效的解决方案是遍历所有段落并根据通配符匹配替换样式。这样做需要确保文档保持活动状态(我通过在循环中添加激活行来实现)。但它花了6个多小时才完成 - 这是不合理的。
基于上面C. Meister的评论,我尝试了OpenXML,这很棒。唯一的问题是OpenXML不运行像'更新目录'这样的单词函数。所以我最终得到了两种方法。一个将一个文件附加到另一个文件并保存生成的文件(样式完整!) - 使用OpenXML。第二个用word interop打开文档,更新目录并按照我想要的方式设置一些设置,然后保存文件。
这是我的代码:
{
string targetFile = "c:\\users\\me\\desktop\\targetFile.docx";
string appendThisFile = "c:\\users\\me\\desktop\\appendThisFile.docx";
string newFile = "c:\\users\\me\\desktop\\newFile.docx";
object newFileObj = newfile; // will need this later to save file
AppendFileToEnd(targetFile, appendThisFile, newFile);
UpdateTOCplusSettings(newFile, ref winWord);
}
// This method appends puts a page break at the end of "targetFile" and
then appends "appendThisFile."
// This method requires adding the WordOpenXML SDK - add using nuget
internal void AppendFileToEnd(string targetFile, string appendThisFile,
string newFile)
{
File.Delete(newFile);
File.Copy(targetFile, newFile);
using (WordprocessingDocument myDoc =
WordprocessingDocument.Open(newFile, true))
{
string altChunkId = "AltChunkId1";
MainDocumentPart mainPart = myDoc.MainDocumentPart;
DocumentFormat.OpenXml.Wordprocessing.Paragraph para = new
DocumentFormat.OpenXml.Wordprocessing.Paragraph(new
DocumentFormat
.OpenXml.Wordprocessing
.Run((new DocumentFormat.OpenXml.Wordprocessing.Break() {
Type = BreakValues.Page })));
mainPart.Document.Body.InsertAfter(para,
mainPart.Document.Body.LastChild);
AlternativeFormatImportPart chunk =
mainPart.AddAlternativeFormatImportPart(
AlternativeFormatImportPartType.WordprocessingML,
altChunkId);
using (FileStream fileStream = File.Open(appendThisFile,
FileMode.Open))
chunk.FeedData(fileStream);
AltChunk altChunk = new AltChunk();
altChunk.Id = altChunkId;
mainPart.Document
.Body
.InsertAfter(altChunk, mainPart.Document.Body
.Elements<DocumentFormat.OpenXml.Wordprocessing
.Paragraph>().Last());
mainPart.Document.Save();
}
}
// This method opens a document and updates the first Table of Contents.
// Note that my project already has a Word Interop object, so I pass it in
// and use it. If you don't have an Word object then you need to
// create one before opening the doc file)
// I also turn off grammar and spelling error - which is a choice of mine
internal void UpdateTOCplusSettings(string filename, ref
Microsoft.Office.Interop.Word.Application winword)
{
Microsoft.Office.Interop.Word.Document wordDocument =
winword.Documents.Open(filename);
wordDocument.ShowGrammaticalErrors = false;
wordDocument.ShowSpellingErrors = false;
wordDocument.TablesOfContents[1].Update();
wordDocument.Save();
}
而不是6小时(加)这个过程需要6分多钟。附加方法不到一秒钟,TOC更新需要6分钟。保存大约需要一秒钟。