是否有开源解决方案显示在线阅读的PDF?它必须像谷歌书籍一样可以搜索,如果可能的话还能显示注释吗?
答案 0 :(得分:6)
通过“在线阅读”我会假设您的意思是客户端没有PDF阅读器插件。在这种情况下,您需要转换为HTML
http://pdftohtml.sourceforge.net/
如果您不介意丢失复制文本的功能,那么转换为PNG可能会为您提供更准确的渲染
无论输出格式如何,您都可以使用原始PDF数据管理搜索。其中一项技术是mnogosearch
Monogosearch在内部使用pdftotext,如果您想编写自己的搜索例程,可能会发现这很有用。 pdftotext是Xpdf实用程序套件
的一部分http://www.foolabs.com/xpdf/about.html
上面列出的所有工具都可以在Windows或Linux上使用
答案 1 :(得分:1)
您可能也对Vuzit DocuPub平台感兴趣:http://vuzit.com/products/docupub_platform
显示技术本身不是开源的,但它们提供了访问其服务的API,因此可能值得研究。
答案 2 :(得分:0)
不知道您是否正在寻找要安装的软件或某些服务来支付... 我已经阅读了很多关于www.getbackboard.com的内容(这不是广告,只报道我读过的内容,可能符合您的需求..;)
答案 3 :(得分:0)
答案 4 :(得分:0)
ICEPdf最近发布了他们的代码作为开源。它是基于Java的。
答案 5 :(得分:0)
PyPdf非常好。它支持读取文本和加密,我知道itextsharp没有。
当然你必须在python中编程,因为IronPython的类库还不能用于从其他语言中引用它们并使用它们。 (但我想他们很快就会有一天) PyPdf
答案 6 :(得分:0)
这不是开源的,但无论如何都要检查出来。您可以下载其SDK的免费试用版以进行试用。阅读PDF及其注释并不简单,我不相信开源解码器的生产应用程序。
这是一个在线演示。 http://www.atalasoft.com/ajaxannotations/default.aspx
另一个优秀的PDF阅读器是FoxitReader。