Tika搞砸了我的文档结构,如何修复它?

时间:2017-05-15 16:52:16

标签: python python-3.x apache-tika data-munging

从一些PDF文件中提取文本内容后,我注意到tika错位了我的文档文本,例如我的原始PDF文档看起来像这样:

Animal name:                            Cat
Food stock:                             Avalaible
type:                                   male

使用tika之后:

cat
Animal name:                            
Available
Food stock:                             
male
type:                                   

我如何告诉tika保留白色空间?。

0 个答案:

没有答案