如何使用OpenXML获取格式化word文档的内容?

时间:2014-10-19 21:12:45

标签: c# itextsharp openxml-sdk

我正在使用此代码阅读word文档的内容,并使用iTextSharp库将内容保存为PDF文件:

WordprocessingDocument wordprocessing = WordprocessingDocument.Open(stream, false);
Body body = wordprocessing.MainDocumentPart.Document.Body;
using (var pdfDoc = new Document(PageSize.A4))
{
    var pdfWriter = PdfWriter.GetInstance(pdfDoc, new FileStream("Test.pdf", FileMode.Create));
    pdfDoc.Open();
    var fontPath = Environment.GetEnvironmentVariable("SystemRoot") + "\\fonts\\tahoma.ttf";
    var baseFont = BaseFont.CreateFont(fontPath, BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
    var tahomaFont = new iTextSharp.text.Font(baseFont, 10, iTextSharp.text.Font.NORMAL, BaseColor.BLACK);
    var ct = new ColumnText(pdfWriter.DirectContent) {RunDirection = PdfWriter.RUN_DIRECTION_RTL};
    ct.SetSimpleColumn(100, 100, 500, 800, 24, Element.ALIGN_RIGHT);
    var stringBuilder = new StringBuilder();
    foreach (var item in body)
    {
        stringBuilder.Append(item.InnerText);
    }
    var chunk = new Chunk(stringBuilder.ToString(), tahomaFont);
    ct.AddElement(chunk);
    ct.Go();
}

一切正常,但文档的内容在没有任何格式的情况下保存。实际上我想将文档文件的格式转换为PDF文件。所以我的问题是我的内容及其格式如何。正如我所提到的,我想要相同的结果 有什么想法吗?

0 个答案:

没有答案