这是一个pdf文档的示例,我需要从中提取用户的选择http://www.ada.gov/hospcombrprt.pdf。如果我们查看页面源代码,我们会看到像:
<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin"
src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
</body>
</html>
我们如何从这个嵌入式pdf中获取用户的选择?
我发现了一篇关于从pdf文档here中提取整个文本的帖子,以及类似于我的帖子here的帖子,其中写道没有这样的可能性。
但应该有一些出路。可能有可能提取整个文本,然后以某种方式确定选择了什么?或者通过鼠标向下和向上事件中的鼠标光标位置确定选择?非常感谢任何想法。
答案 0 :(得分:5)
我怀疑这是可能的 - 如果是的话,就没有通用的解决方案,因为每个PDF查看器都是不同的。
并非每个人都使用Adobe自己的Acrobat插件。 Foxit很受欢迎。这两个插件都很可能不提供访问此信息的接口。
Chrome和Firefox等浏览器现在提供了一个内置的PDF查看器,它与插件完全不同。
另外,您是否在其他域上访问PDF?在这种情况下,同源政策无论如何都会阻止访问此类信息。
最后,您需要考虑并非每个用户都喜欢使用(甚至允许使用)PDF浏览器插件,因此您的“解决方案”在这些情况下无效。
还有一点:您使用过时的embed
元素而不是object
这一事实表明您正在使用非常古老的知识。
您可能需要退后一步,并重新考虑您在此尝试做什么。大局是什么?你想要实现什么目标?
答案 1 :(得分:0)
我也想要一种从网页上的pdf中获取所选文本的方法,而且我遇到了pdftron,当然这不是本地方法。您可以使用pdftron's webviewer使用以下方法从pdf中获取选定的文本:
var selectedText = myWebViewer.getInstance().docViewer.getSelectedText();