HTML to PDF土耳其语字符问题

时间:2010-10-26 11:22:21

标签: pdf character-encoding itextsharp turkish

我想使用ITextSharp将ASP.NET网页转换为pdf。我写了一些代码,但我不能让它显示土耳其字符。任何人都可以帮助我吗?

以下是代码:

using System;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;

using System.Web.UI;
using System.Web;
using iTextSharp.text.html.simpleparser;
using System.Text;
using System.Text.RegularExpressions;

namespace Presentation
{
    public partial class TemporaryStudentFormPrinter : System.Web.UI.Page
    {
        protected override void Render(HtmlTextWriter writer)
        {
            MemoryStream mem = new MemoryStream();
            StreamWriter twr = new StreamWriter(mem);
            HtmlTextWriter myWriter = new HtmlTextWriter(twr);
            base.Render(myWriter);
            myWriter.Flush();
            myWriter.Dispose();
            StreamReader strmRdr = new StreamReader(mem);
            strmRdr.BaseStream.Position = 0;
            string pageContent = strmRdr.ReadToEnd();
            strmRdr.Dispose();
            mem.Dispose();
            writer.Write(pageContent);
            CreatePDFDocument(pageContent);
        }
        public void CreatePDFDocument(string strHtml)
        {
            string strFileName = HttpContext.Current.Server.MapPath("test.pdf");
            Document document = new Document(PageSize.A4, 80, 50, 30, 65);
            PdfWriter.GetInstance(document, new FileStream(strFileName, FileMode.Create));

            StringReader se = new StringReader(strHtml);
            HTMLWorker obj = new HTMLWorker(document);

            document.Open();

            obj.Parse(se);
            document.Close();
            ShowPdf(strFileName);
        }
        public void ShowPdf(string strFileName)
        {
            Response.ClearContent();
            Response.ClearHeaders();
            Response.AddHeader("Content-Disposition", "inline;filename=" + strFileName);
            Response.ContentType = "application/pdf";
            Response.WriteFile(strFileName);
            Response.Flush();
            Response.Clear();
        }

        protected void Page_Load(object sender, EventArgs e)
        {

        }
    }
}

2 个答案:

答案 0 :(得分:9)

iTextSharp.text.pdf.BaseFont STF_Helvetica_Turkish = iTextSharp.text.pdf.BaseFont.CreateFont("Helvetica", "CP1254", iTextSharp.text.pdf.BaseFont.NOT_EMBEDDED);

iTextSharp.text.Font fontNormal = new iTextSharp.text.Font(STF_Helvetica_Turkish, 12, iTextSharp.text.Font.NORMAL);

您应该将字体作为参数传递给itextsharp操作命令,如:

pdftable.AddCell(new Phrase(nn.InnerText.Trim(), fontNormal));

您可能需要考虑使用具有pdf导出功能的报告工具,而不是使用pdf进行直接处理,这可能是一个真正令人头痛的问题。

答案 1 :(得分:0)

您需要确保在支持土耳其字符集的字体中写入文本(或者至少是您尝试写出的字符)。

我不知道HtmlTextWriter在字体使用方面做了什么 - 它可能会使用一种标准的内置字体,如果不属于Latin1或Latin1-,则不太可能支持您要打印的字符扩展的Unicode范围。

我使用BaseFont.createFont(...)在iText(Java)中包含我的PDF中的外部字体 - 支持我正在编写的所有字符。您可以创建Font对象,然后将其传递给HtmlTextWriter?