从一些PDF文件中提取文本内容后,我注意到tika错位了我的文档文本,例如我的原始PDF文档看起来像这样:
Animal name: Cat
Food stock: Avalaible
type: male
使用tika之后:
cat
Animal name:
Available
Food stock:
male
type:
我如何告诉tika保留白色空间?。