我想在现有的PDF文件中插入不可见的文字,以便进行搜索。
我应该使用什么库? 我希望能够使用指向 API方法的链接。
免费,理想的开源。
非常感谢!
(对于好奇:我想在Alfresco存储库中自动OCR传入扫描的文件并使其成为可搜索的)
答案 0 :(得分:3)
3个选项。
myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
myPdfStamper.getUnderContent(pageNum)
可让您在扫描下绘制文字。答案 1 :(得分:1)
答案 2 :(得分:0)
您不必将文本呈现为不可见。只需在适当的位置渲染它们,但将扫描的图像覆盖在文本上。或者,您可以在图像上渲染文本,并将笔划和笔刷颜色的alpha值设置为零。