iTextSharp HTML到PDF转换 - 无法更改字体

时间:2015-12-22 09:57:15

标签: html asp.net-mvc pdf fonts itextsharp

我正在使用ASP.NET MVC5应用程序中的HTML从iTextSharp(5.5.7.0)创建一些PDF文档,但我无法更改字体。我已经尝试了几乎所有我能在SO或其他资源上找到的东西。

PDF生成代码如下:

    public Byte[] GetRecordsPdf(RecordsViewModel model)
    {
        var viewPath = "~/Template/RecordTemplate.cshtml";
        var renderedReport = RenderViewToString(viewPath, model);

        FontFactory.RegisterDirectory(Environment.GetFolderPath(Environment.SpecialFolder.Fonts));

        using (var ms = new MemoryStream())
        {
            using (var doc = new Document())
            {
                doc.SetPageSize(PageSize.A4.Rotate());

                using (var writer = PdfWriter.GetInstance(doc, ms))
                {
                    doc.Open();

                    using (var html = new MemoryStream(Encoding.Default.GetBytes(renderedReport)))
                    {
                        XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, html, Encoding.Default);
                    }

                    doc.Close();
                }
            }

            var bytes = ms.ToArray();
            return bytes;
        }
    }

实际的HTML包含在renderedReport字符串变量中(我有强类型的.cshtml文件,我使用MVC Razor引擎渲染,然后在字符串中返回HTML)。

我试图注册一些特定的字体,但这没有帮助。我也尝试在我的机器上注册所有字体(如上例所示),但这也没有帮助。加载了字体我在调试模式下检查过。

CSS嵌入在HTML文件中(在标题,样式标记中),如下所示:

    body {
        font-size: 7px;
        font-family: Comic Sans MS;
    }

(为了测试,我决定使用Comic Sans,因为我可以轻松识别它,我实际上对Arial Unicode MS更感兴趣。)

我实际上可以使用CSS中的font-family属性更改字体,但仅限于默认情况下由iTextSharp预装的字体 - Times New Roman,Arial,Courier等等(Helvetica)我认为)。当我将其更改为 - 漫画Sans,或其他一些未预装的iTextSharp渲染时使用默认字体(Arial我会说)。

我需要更改字体的原因是因为我在PDF中删除了我的渲染HTML(ČĆŠĐŽčćšđž)中的一些克罗地亚字符,目前我认为主要原因是 - font。

我错过了什么?

1 个答案:

答案 0 :(得分:7)

使这项工作成为可能。

首先,XMLWorkerHelper默认情况下不使用FontFactory,您需要使用ParseXHtml()之一的IFontProvider重载。这两个重载都要求您为CSS文件指定Stream,但如果您的CSS存在于HTML文件中,则可以传递null。幸运的是,FontFactory有一个静态属性,可以使用名为FontFactory.FontImp

的静态属性
//                                                                                 **This guy**
XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, msHTML, null, Encoding.UTF8, FontFactory.FontImp);

其次,我知道你说你试图在绝望中注册你的整个字体目录,但这可能是一个相当昂贵的电话。如果可以,请始终尝试只注册所需的字体。虽然是可选的,但我还强烈建议您明确定义字体的别名,因为字体可以有多个名称,但它们并不总是我们想的。

FontFactory.Register(Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts), "comic.ttf"), "Comic Sans MS");

第三,这可能不会对您产生影响,但HTML中没有的任何标签,即使它们在逻辑上是暗示的,也不会从CSS中应用样式。这听起来很奇怪,所以换句话说,如果你的HTML只是<p>Hello</p>而你的CSS是body{font-size: 7px;},则字体大小将不会被应用,因为你的HTML缺少<body>标记。

第四,这是可选的,但通常更容易分别指定你的HTML和CSS,我将在下面的例子中做。

你的代码是95%那么只需要进行一些调整就可以了。我只是解析原始HTML和CSS而不是视图,但您可以根据需要进行修改。请记住(我想您知道这一点)iTextSharp 无法处理ASP.Net ,只能处理HTML,因此您需要确保您的ASP.Net到HTML转换过程是理智的。

//Sample HTML and CSS
var html = @"<body><p>Sva ljudska bića rađaju se slobodna i jednaka u dostojanstvu i pravima. Ona su obdarena razumom i sviješću i trebaju jedna prema drugima postupati u duhu bratstva.</p></body>";
var css = "body{font-size: 7px; font-family: Comic Sans MS;}";

//Register a single font
FontFactory.Register(Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts), "comic.ttf"), "Comic Sans MS");

//Placeholder variable for later
Byte[] bytes;

using (var ms = new MemoryStream()) {
    using (var doc = new Document()) {
        doc.SetPageSize(PageSize.A4.Rotate());

        using (var writer = PdfWriter.GetInstance(doc, ms)) {
            doc.Open();

            //Get a stream of our HTML
            using (var msHTML = new MemoryStream(Encoding.UTF8.GetBytes(html))) {

                //Get a stream of our CSS
                using (var msCSS = new MemoryStream(Encoding.UTF8.GetBytes(css))) {

                    XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, msHTML, msCSS, Encoding.UTF8, FontFactory.FontImp);
                }
            }

            doc.Close();
        }
    }

    bytes = ms.ToArray();
}