如何在java / jsp或javascript中阅读扫描的pdf文件的内容,您能告诉我们如何通过开发代码来实现这一目标吗?
预先感谢您的回复
答案 0 :(得分:2)
答案 1 :(得分:0)
谷歌与OCR相关的任何事情, 最好的选择是使用现有的库,如http://asprise.com/product/ocr/index.php?lang=java
答案 2 :(得分:0)
你想要做的(我认为)是使用OCR从扫描仪生成的图像PDF中提取文本。 Java可能是最好的。执行此操作有多种选择,具体取决于您是否准备为软件付费以执行此操作。 Google for Java(或Javascript),PDF和OCR。
IMO,这项任务不应该在JSP中完成。 JSP最适合渲染结果......而不是首先生成它们。
答案 3 :(得分:0)
实际上,我目前正在研究同一个项目,我是按照以下步骤进行的,效果很好。