将自定义元数据添加到二进制文件

时间:2019-11-28 09:26:08

标签: java metadata

如何在不使用数据库的情况下将自定义元数据包含在文件中,以后再使用 Apache Tika 进行提取。文件扩展名为* .doc .docx .pdf .txt .... *

1 个答案:

答案 0 :(得分:0)

这可以使用PDFBox进行修改

这是github上的示例,其说明在介质上

https://github.com/enisinanaj/pdfbox-metadata-example

https://medium.com/@enisinanaj/how-to-write-custom-metadata-to-a-pdf-document-in-java-with-pdfbox-f52a82ab1b09

只需添加Main方法并调用insertMetadata()

设置服装元数据使用

info.setCustomMetadataValue("ispublished", "true");