如何将不可见的文本插入PDF?

时间:2011-02-28 04:46:26

标签: pdf itext pdfbox

我想在现有的PDF文件中插入不可见的文字,以便进行搜索。

我应该使用什么库? 我希望能够使用指向 API方法的链接。

免费,理想的开源。
非常感谢!

(对于好奇:我想在Alfresco存储库中自动OCR传入扫描的文件并使其成为可搜索的)

3 个答案:

答案 0 :(得分:3)

3个选项。

  1. 文字渲染模式3:“没有笔画,没有填充”。 myPdfContentByte.setTextRenderMode(PdfContentByte.TEXT_RENDER_MODE_INVISIBLE);
  2. 在背后绘制文字。你可能已经扫描了页面的图像。 iText的myPdfStamper.getUnderContent(pageNum)可让您在扫描下绘制文字。
  3. 在页面的媒体或裁剪框外绘制文本。如果您只是想要一些随机的PDF搜索引擎来打开您的页面,这将有效,但如果您希望人们查看PDF以查看相应的文本选择框...而不是那么多。

答案 1 :(得分:1)

This显示了如何创建包含文本的PDF文档,this显示了如何添加图像。首先添加文本,然后在其上添加图像 - 文本将对最终用户“隐藏”,但搜索引擎仍可搜索。 This也可能有用。

答案 2 :(得分:0)

您不必将文本呈现为不可见。只需在适当的位置渲染它们,但将扫描的图像覆盖在文本上。或者,您可以在图像上渲染文本,并将笔划和笔刷颜色的alpha值设置为零。