我们已经实施了算法来解析电子邮件并从中收集信息,就像电子邮件是
一样Hi John,
Here is your reservation info
Name : John F
Date : 2/12/2013
State : NY ....
我们为每个电子邮件表单保存配置,例如“查找键”,如“名称”,“日期”,“状态”..这些是我们的密钥,“:”是分隔符,“:”之后的任何内容都是该键的值为。这就是我们解析和收集我们想要的信息的方式。我们从GMAIL收件箱中阅读了电子邮件,有时我们从GMAIL获得的电子邮件正文混乱,我们的算法无法读取KEY:VALUE对并且没有捕获任何内容。如果您在GMAIL收件箱中看到实际电子邮件,它的所有格式和内容都很整洁,但我们在代码中获得的电子邮件来源是不同的。不确定这是否必须对编码做任何事情。请说明可能是什么原因。感谢
真的很感激你的想法。
这是一个例子,第一个图像是我们在gmail中看到的,第二个图像是我们作为源获取的内容(纯文本非HTML)。顺便说一下我们解析纯文本而不是HTML