PHP - 从PDF读取用户选择的文本的解决方法?

时间:2012-04-24 06:24:10

标签: php javascript pdf

我正在开发一个项目,允许用户使用日语从HTML页面上传文本或内容,然后使用光标选择文本/内容中的单词翻译成英文。但是,我希望能够将此功能扩展为PDF文件。基本上,我希望用户能够提交PDF文件并让浏览器呈现PDF文件,以便当用户选择/突出显示PDF中的文字时,浏览器可以某种方式传递文本的内容。突出显示的部分,例如通过javascript,然后被中继到PHP变量。

我知道stackoverflow上有很多关于类似问题的帖子(我花了几个小时试图对它们进行整理!),但我似乎无法找到关于这是否可行的明确答案。似乎有很多选项可以将PDF转换为HTML或从PDF中提取文本,但说实话,我很困惑,如果这些选项中的任何一个与我想要完成的内容相关。我知道有一个适用于Adobe的JavaScript API,但我的印象是javascript需要嵌入到PDF中,如果用户上传自己的PDF文件进行渲染,则不会这样。即使这是可能的,似乎Adobe javascript API中没有原生文本选择支持....

这样做是否有直接的解决方法(矛盾?)?同样,我希望能够将PDF中选择的文本传递给变量 - 效果是用户突出显示他们不知道的单词,因此可以将这些单词添加到单词库中以便在字典中进行检索。

让我知道我是否可以更清楚。谢谢!

1 个答案:

答案 0 :(得分:0)

我认为您最好的办法是将PDF转换为HTML(请参阅this answers),然后您就已经设置了,因为您已经为常规HTML实现了所有内容。