是否可以使用LEADTOOLS将html文本(字符串)转换为pdf?

时间:2015-03-03 13:02:17

标签: pdf leadtools-sdk

我正在尝试使用LEADTOOLS将包含html数据的文本转换为PDF,但我没有得到任何将字符串直接转换为PDF的示例,但我可以将该字符串转换为文本(.txt)或HTML(.htm )首先文件,然后将其转换为PDF。

1 个答案:

答案 0 :(得分:-1)

大多数情况下(如果不是总是),矢量/ postscript PDF的大小小于光栅PDF。有几种方法可以实现这一目标:

1。)使用RasterCodecs类加载HTML。这将光栅化HTML呈现或直接文本。从这里,您可以将光栅图像保存为光栅PDF(不可搜索)或OCR图像。使用来自OCR引擎的数据,LEADTOOLS文档编写器将创建一个可搜索的(基于矢量的)PDF。使用设置为true的PDFDocumentOptions.ImageOverText属性将显示原始HTML并将识别的文本放在后台。

2。)使用DocumentReader类加载HTML。 DocumentReader类将保留嵌入在HTML中的图像标记。这也会栅格化文档。

3.使用LEADTOOLS虚拟打印机驱动程序,您可以从Web浏览器打印HTML。打印机驱动器将生成EMF(矢量文件)LEADTOOLS然后可以使用文档编写器转换为可搜索的PDF。此处不需要OCR,因为此转换中的文本未进行栅格化。

如果您已经下载并安装了工具包,那么您可以查看多个演示,以帮助您实现上述功能:

使用RasterCodecs加载 - [Leadtools安装目录] \ Shortcuts \ File Formats.NET类库\主要演示

使用DocumentReader加载 - [Leadtools安装目录] \ Shortcuts \ Document Viewer.NET类库\文档查看器

执行OCR - [Leadtools安装目录] \快捷方式\ OCR - MICR - ICR - OMR.NET类库\主OCR演示

使用DocumentWriter类 - [Leadtools安装目录] \ Shortcuts \ Document Writers.NET类库\文档编写器

使用虚拟打印机演示 - [Leadtools安装目录] \快捷方式\ Virtual Printer.NET类库\虚拟打印机

链接转储: https://www.leadtools.com/help/leadtools/v19/dh/co/leadtools.codecs~leadtools.codecs.rastercodecs.html https://www.leadtools.com/help/leadtools/v19/dh/fe/leadtools.forms.documentreaders~leadtools.forms.documentreaders.documentreader.html https://www.leadtools.com/sdk/ocr/ https://www.leadtools.com/help/leadtools/v19/dh/fo/leadtools.forms.ocr~leadtools.forms.ocr.iocrengine.html https://www.leadtools.com/help/leadtools/v19/dh/fo/leadtools.forms.ocr~leadtools.forms.ocr.iocrdocument.html https://www.leadtools.com/help/leadtools/v19/dh/ft/leadtools.forms.documentwriters~leadtools.forms.documentwriters.documentwriter.html https://www.leadtools.com/help/leadtools/v18/dh/ft/leadtools.forms.documentwriters~leadtools.forms.documentwriters.pdfdocumentoptions~imageovertext.html https://www.leadtools.com/help/leadtools/v19/dh/to/leadtools.topics.printer~pr.topics.programmingwithvirtualprinterdriver.html