我正在使用Spark解析Gmail邮件标题。我看到同一个键的语法不同,例如消息ID, 消息ID,消息ID,消息ID
我想知道标题键语法是否有任何标准?
仅供参考:
我将此标头数据放入org.apache.spark.sql.Row
中,并且必须按如下方式进行解析:
String msgId = row.getString(row.fieldIndex(“ Message-Id”))
由于row.fieldIndex(String str)
是区分大小写的,因此我必须检查所有3个字符串(消息ID,消息ID,消息ID),以确保我不会错过消息ID的值。其他许多键也是如此。
有没有更好的方法来解决这个问题?