将HTML转换为PDF并保留字母间距

时间:2015-06-12 15:10:07

标签: html pdf converter

我们有许多文件需要转换为在网络浏览器中创建搜索/突出显示单词功能,并为服务器端的可搜索单词编制索引。

我使用http://pdf.investintech.com在线服务(链接页面上的第1步,第2步)将PDF转换为HTML。我也尝试过其他人。

PDF具有带背景阴影的表格。此转换器对每行文本使用绝对定位,但是渲染的文本行稍长,导致它超出背景阴影区域。

有没有一个解决方案,你可以指出我将保留字母间距,所以我可以转换为HTML而没有像改变句子长度这样的异常?垂直对齐也很重要,但是每行绝对定位一个单独的div可以很好地处理它。

1 个答案:

答案 0 :(得分:0)

经过一些额外的Google搜索后,我发现了这个项目,它似乎比我能找到的任何其他项目更强大。它特别擅长文本对齐和选择处理。

https://github.com/coolwanglu/pdf2htmlEX