如何使用Apache Tika通过使用Apache Metadata类提取" Subject“字段?

时间:2017-04-06 20:02:40

标签: java apache apache-tika

我试图提取"主题"来自电子邮件的字段,但我遇到了一些麻烦。我得到了#34; To"和"来自"字段已经如此:

String messageTo =  tikaMetadata.MESSAGE_TO;   //Works fine
String toField =  tikaMetadata.get(messageTo); //Works fine


System.out.println("From field is : " + fromField); //Works fine
System.out.println("To field is : "  + toField);    //Works fine


String messageSubj =  tikaMetadata.getValues("Message:Raw-Header:Subject"); 
String subjField =  tikaMetadata.get(messageTo); //Doesn't Work

我们如何使用Tika提取主题字段? 任何提示有用的谢谢

1 个答案:

答案 0 :(得分:6)

您可以尝试两种方式:

  1. String subjectObs = tikaMetadata.get(tikaMetadata.SUBJECT);  但在.SUBJECT被弃用的地方

  2. String subject = tikaMetadata.get(TikaCoreProperties.DESCRIPTION);可能是最接近Metadata.SUBJECT的替代品(有关TikaCoreProperties的详细信息,请查看此内容:tika documentation