标签: solr formatting apache-tika captions
我们正在使用Solr和Tika搜索外部数据,例如PDF和文档。 然而,有了这个,我们只得到没有格式的原始文本。 我们还希望获得格式和元数据,如标题和项目符号。 有没有办法得到它?
谢谢你, 摩西