标签: java python shell pdf apache-tika
我正在尝试使用ApacheTika命令行工具从pdf中提取图像。
我有一个python服务器,我不想用Java重建它只是为了使用Tika。我的解决方案是使用命令行工具从pdf中提取图像,然后从python中读取它。问题是当我将--extract或-z命令发送到命令行工具时,它不会从pdf中提取图像。
--extract
-z
我知道可以从这个pdf中提取图像,因为之前我使用的是pdfimages,而且它正确地提取了这些图像。
pdfimages
任何人都可以帮我解决这个问题。
以色列