A.nnotate.com背后使用了什么技术?

时间:2011-07-24 13:04:42

标签: html5 pdf annotations scribd document-conversion

我想知道A.nnotate.com,Scribd,Google Docs等服务如何将pdf,.doc或任何其他文档呈现为HTML以及注释系统如何工作?

1 个答案:

答案 0 :(得分:5)

A.nnotate.com使用xpdf以给定的缩放级别将PDF页面的服务器端转换为PNG图像 - 这些是在浏览器中显示的内容。

文本突出显示是通过从PDF中提取文本位置,然后在页面图像的顶部添加透明覆盖图,并在文字顶部放置绝对定位的html DIVS。然后,注释使用ajax gui将注释附加到突出显示的文本。

其他格式(MS Word,PPT等)首先使用openoffice转换为PDF,然后转换为PDF格式的图像和文本叠加。

我认为其他HTML文档网站的做法类似于将PDF呈现为HTML(即页面图像+文字叠加作为透明div) - 另一种技巧是将PDF嵌入字体转换为HTML5 CSS字体,并使用绝对定位的div文本(也提取和定位图像)。