我希望在命令行上使用apache tika提取有关word文件的元数据,如何使用apache tika,我该怎么办?
答案 0 :(得分:1)
大家好我想通了,
我必须下载tika-app-1.5.jar并执行以下命令,它返回了我想要的所有细节
java -jar tika-app-1.5.jar -m test.docx
java -jar tika-app-1.5.jar -m test.doc
java -jar tika-app-1.5.jar -m test.pptx
java -jar tika-app-1.5.jar -m test.ppt