应用错误收集

Itext TextRenderInfo用于不同的pdf的不同行为

时间：2017-06-05 16:59:37

标签： itext

我正在使用 itext - ＆gt; LocationTextExtractionStrategy ，用于从PDF中检索文字，我已阅读2种不同的pdf并进行调试对于我找到的第一个 public void renderText(TextRenderInfo renderInfo)

方法文本用word渲染例如：我有一些带有一些内容的pdf

ACCOUNT TYPE A/C. BALANCE (I) FIXED DEPOSITS (LINKED) BAL. (II)

然后renderText方法在循环中呈现文本，如： 帐户类型然后 A / C.平衡（I）然后固定存款（链接）BAL。（II）

现在，当我调试2 pdf内容并且用字母呈现时，例如我有内容：

提款日期详情

然后renderText方法在循环中呈现文本： D 然后 a 然后 t 然后 e 等等

我想知道它是如何呈现文本的（意味着一些时间用单词迭代，一段时间用一组单词迭代，一些时间用一个字母迭代）？

1 个答案:

答案 0 :(得分：0)

它如何呈现文本（意味着一些时间用单词迭代，一些时间用一组单词迭代，一些时间用一个字母迭代）？

iText解析框架转发PDF文本绘制操作的参数中使用的原子字符串。

因此，如果PDF逐字逐句地绘制文本，则每封信件将收到一个TextRenderInfo个实例。如果它逐字逐句绘制文本，则每个单词将收到一个实例。