标签: performance apache-tika
我们正在使用tika 1.9库来提取内容。系统处理传入的数据并提取其内容。 为了提高性能,我们有100个线程实际上从tika中提取数据。虽然如果我们将线程提升到超过100,但没有进一步的性能提升。
我们在线程中使用相同的AutoDetectParser实例,是否会导致瓶颈?
此外,tika中是否有任何可以进行微调以改善内容提取性能的内容。
我们也尝试过与tika 1.15相同的练习,但同样没有任何表现上的提升。
此致 拉夫