使用TIKA时忽略页眉/页脚文本

时间:2013-05-31 17:02:19

标签: apache-tika ikvm

我正在使用IKVM以在.NET应用程序中使用TIKA库。我能够提取文本,但现在我想告诉TIKA我不想要页眉/页脚信息。 TIKA案例TIKA-906显示最新版本现在包含页眉/页脚文本,但未显示如何排除它。

我几乎使用了here概述的相同代码。

非常感谢任何帮助。

0 个答案:

没有答案