我有成千上万的pdf文件。在将它们上传到我的数据库时,其中一些会出现转换错误,即[IOException: Error converting date: '£gLùY‹»’î]G…ˇÅìùJÌ܇^']
或[IOException: Error converting date: 'D:191000724110432']
。具有日期错误的文档也具有与其余文档相同的格式。
这是我的转换功能:
public static String getProperDate(Calendar cal) {
SimpleDateFormat dateFormat = new SimpleDateFormat("dd-MM-yyyy");
String properDate = dateFormat.format(cal.getTime());
return properDate;
}
如果我将格式更改为(dd-MMM-yyyy)
,我也会收到同样的错误。
这是因为pdf还是编码错误?我的所有pdf具有相同的格式,但其中一些显示此错误。
我正在使用PDFBox来获取pdf的元数据。
PDDocument document = PDDocument.load(file);
PDDocumentInformation info = document.getDocumentInformation();
indexed.creationDate = getProperDate(info.getCreationDate());
答案 0 :(得分:1)
请提及字符串解码格式。 试试吧 String properDate = new String(dateFormat.format(cal.getTime())," UTF-8");