如何在c#

时间:2018-02-12 06:50:40

标签: c# html html-to-pdf spire.doc

我正在使用spire doc将单个HTML页面转换为Doc。我需要将多个html页面从单个文件夹转换为单个Doc。如何做到这一点。任何人都可以提供一些想法或任何可用的库来实现这一目标吗?

请找到我的代码,将单个HTML转换为文档。

 Spire.Doc.Document document = new Spire.Doc.Document();
 document.LoadFromFile(@"D:\DocFilesConvert\htmlfile.html", Spire.Doc.FileFormat.Html, XHTMLValidationType.None);
 document.SaveToFile(@"D:\DocFilesConvert\docfiless.docx", Spire.Doc.FileFormat.Docx);

1 个答案:

答案 0 :(得分:0)

似乎没有直接的方法可以实现这一目标。我发现一种解决方法是将每个HTML文档转换为单个Word文件,然后将这些Word文件合并为一个文件。

//get HTML file paths
string[] htmlfilePaths = new string[]{

    @"F:\Documents\Html\1.html",
    @"F:\Documents\Html\2.html",
    @"F:\Documents\Html\3.html"
};

//create Document array
Document[] docs = new Document[htmlfilePaths.Length];

for (int i = 0; i < htmlfilePaths.Length; i++)
{
    //load each HTML to a sperate Word file
    docs[i] = new Document(htmlfilePaths[i], FileFormat.Html);

    //combine these Word files in one file
    if (i>=1)
    {
        foreach (Section sec in docs[i].Sections)
        {
            docs[0].Sections.Add(sec.Clone());
        }                 
    }
}

//save to a Word document
docs[0].SaveToFile("output.docx", FileFormat.Docx2013);