我正在寻找一个java实用程序,用户可以通过该实用程序转换任何类型的文件(pdf,doc,docx,xls,xlsx,csv,rtf,txt)。我们要求用户可以上传任何类型的文件,我们需要读取文件的内容(仅文本),转换它并将其存储在对象中。这可以使用Apachi poi完成,但我想知道是否存在任何java实用程序?
答案 0 :(得分:4)
您可能对Apache Tika感兴趣,其中包括Apache POI和PDFBox的功能。从项目描述中,工具包:“使用现有的解析器库从各种文档中检测并提取元数据和结构化文本内容。”
答案 1 :(得分:0)
我想你不能为每种类型的文件都有某种通用功能。您需要为每种文件类型实现转换方法。 This link可以帮助处理PDF文件,还可以为您提供一个模板来处理其他文件类型。