我们有许多文件需要转换为在网络浏览器中创建搜索/突出显示单词功能,并为服务器端的可搜索单词编制索引。
我使用http://pdf.investintech.com在线服务(链接页面上的第1步,第2步)将PDF转换为HTML。我也尝试过其他人。
PDF具有带背景阴影的表格。此转换器对每行文本使用绝对定位,但是渲染的文本行稍长,导致它超出背景阴影区域。
有没有一个解决方案,你可以指出我将保留字母间距,所以我可以转换为HTML而没有像改变句子长度这样的异常?垂直对齐也很重要,但是每行绝对定位一个单独的div可以很好地处理它。
答案 0 :(得分:0)
经过一些额外的Google搜索后,我发现了这个项目,它似乎比我能找到的任何其他项目更强大。它特别擅长文本对齐和选择处理。