把HTM文件转换为PDF的可能性

时间:2015-10-08 22:06:47

标签: c# html pdf pdf-generation

有没有办法将HTM文件转换为PDF?根据我的理解,HTML和HTM文件扩展名是相同的。考虑到这一点,我使用Spire尝试了以下代码,但我的输出是一个空白PDF。

if (filelist[f].EndsWith(".htm"))
{
    PdfDocument doc = new PdfDocument();

    string filext = System.IO.Path.GetExtension(filelist[f]);
    string outputDocName = filelist[f].Replace(filext, ".pdf");

    doc.SaveToFile(outputDocName);
    doc.Close();
}

我在Google上搜索过,但在将HTML文件转换为PDF方面我找不到多少。我甚至使用ImageMagick查看了Python,但是有多个步骤,所以一旦我用完选项就会尝试。 iTextSharp有可能吗?在将其转换为PDF或我想要做的事情不存在之前,是否需要再次将HTM文件转换为其他文件类型?

1 个答案:

答案 0 :(得分:0)

HTML(文件扩展名为.htm.html)在某种意义上是一个纯文本文件,需要解析和渲染才能生成" visual"输出。因此,如果没有渲染HTML的概念,ImageMagick或类似的工具将无法工作。

如果这是一次性要求 - 获取PDF打印机驱动程序(例如CUPS PDF)并且只打印"打印"浏览器中的页面。

如果这需要是一个自动化过程,我的个人建议将是幻影。但搜索和Google是你的朋友 - Converting HTML to PDF using PHP?