我正在使用spire doc将单个HTML页面转换为Doc。我需要将多个html页面从单个文件夹转换为单个Doc。如何做到这一点。任何人都可以提供一些想法或任何可用的库来实现这一目标吗?
请找到我的代码,将单个HTML转换为文档。
Spire.Doc.Document document = new Spire.Doc.Document();
document.LoadFromFile(@"D:\DocFilesConvert\htmlfile.html", Spire.Doc.FileFormat.Html, XHTMLValidationType.None);
document.SaveToFile(@"D:\DocFilesConvert\docfiless.docx", Spire.Doc.FileFormat.Docx);
答案 0 :(得分:0)
似乎没有直接的方法可以实现这一目标。我发现一种解决方法是将每个HTML文档转换为单个Word文件,然后将这些Word文件合并为一个文件。
//get HTML file paths
string[] htmlfilePaths = new string[]{
@"F:\Documents\Html\1.html",
@"F:\Documents\Html\2.html",
@"F:\Documents\Html\3.html"
};
//create Document array
Document[] docs = new Document[htmlfilePaths.Length];
for (int i = 0; i < htmlfilePaths.Length; i++)
{
//load each HTML to a sperate Word file
docs[i] = new Document(htmlfilePaths[i], FileFormat.Html);
//combine these Word files in one file
if (i>=1)
{
foreach (Section sec in docs[i].Sections)
{
docs[0].Sections.Add(sec.Clone());
}
}
}
//save to a Word document
docs[0].SaveToFile("output.docx", FileFormat.Docx2013);