itextSharp - html到pdf一些土耳其字符丢失

时间:2014-01-28 05:10:49

标签: itextsharp

当我尝试从HTML生成PDF时,PDF中缺少ĞÜŞİÖÇ ğüşıöç等一些土耳其字符,我看到一个空格代替这些字符,但我想打印该字符。< / p>

我的代码是:

public virtual void print pdf(string html, int id)
{
    String htmlText = html.ToString();
    Document document = new Document();
    string filePath = HostingEnvironment.MapPath("~/Content/Pdf/");
    PdfWriter.GetInstance(document, new FileStream(filePath + "\\pdf-"+id+".pdf", FileMode.Create));
    document.Open();
    iTextSharp.text.html.simpleparser.HTMLWorker hw =
                     new iTextSharp.text.html.simpleparser.HTMLWorker(document);

    hw.Parse(new StringReader(htmlText));
    document.Close();
}

如何在PDF上打印所有土耳其字符?

4 个答案:

答案 0 :(得分:4)

我终于找到了解决这个问题的方法,你可以打印所有的土耳其字符。

    String htmlText = html.ToString();
    Document document = new Document();
    string filePath = HostingEnvironment.MapPath("~/Content/Pdf/");
    PdfWriter.GetInstance(document, new FileStream(filePath + "\\pdf-"+Name+".pdf", FileMode.Create));
    document.Open();

    iTextSharp.text.html.simpleparser.HTMLWorker hw = new iTextSharp.text.html.simpleparser.HTMLWorker(document);
    FontFactory.Register(Path.Combine(_webHelper.MapPath("~/App_Data/Pdf/arial.ttf")),  "Garamond");   // just give a path of arial.ttf 
    StyleSheet css = new StyleSheet();
    css.LoadTagStyle("body", "face", "Garamond");
    css.LoadTagStyle("body", "encoding", "Identity-H");
    css.LoadTagStyle("body", "size", "12pt");

    hw.SetStyleSheet(css);

    hw.Parse(new StringReader(htmlText));

答案 1 :(得分:3)

我的问题解决了这个问题;

var pathUpload = Server.MapPath($"~/Test.pdf");
using (var fs = System.IO.File.Create(pathUpload))
{
   using (var doc = new Document(PageSize.A4, 0f, 0f, 10f, 10f))
   {
       using (var writer = PdfWriter.GetInstance(doc, fs))
       {
           doc.Open();
           BaseFont baseFont = BaseFont.CreateFont("C:\\Windows\\Fonts\\Arial.ttf", "windows-1254", true);
           Font fontNormal = new Font(baseFont, 24, Font.NORMAL);

           var p = new Paragraph("Test paragrapgh İÇşıĞğŞçöÖ", fontNormal);
           doc.Add(p);
           doc.Close();
       }
   } }

答案 2 :(得分:1)

经过几天的研究,我得到了相同的答案;

BaseFont myFont = BaseFont.CreateFont(@"C:\windows\fonts\arial.ttf", "windows-1254", BaseFont.EMBEDDED);  
Font fontNormal = new Font(myFont);

Eveytime你需要写一个有特殊字符的文字,这样做;

doc.Add(new Paragraph("İıĞğŞşÜüÖöŞşÇç", fontNormal));     // a new paragraph
results.Add(new ListItem("İıĞğŞşÜüÖöŞşÇç", fontNormal));  // a new list item

另外,itextsharp可能需要这样才能让字体改变;

using Font = iTextSharp.text.Font; 

它就像一个魅力:)

答案 3 :(得分:0)

我遇到了类似的问题,无法使 CP1254 编码正常工作,但我找到了另一个对我有用的解决方案。

在css中添加“font-family: Arial;”并把它放在外面的 div 标签上。

.className{
   font-family: Arial;
}

<div class="className">
...
</div>

我在这里找到了这个答案:How to generate a valid PDF/A file using iText and XMLWorker (HTML to PDF/A process)

找到这个解决方案花了很长时间,但我发现它正在寻找一种字体解决方案来显示土耳其语字符。