我们正在显示从Outlook导出的.MSG文件中提取的HTML正文。
要显示HTML正文,需要从PR_RTF_Compressed
字段解压缩RTF,然后将RTF解码为HTML(outlook在导出MSG文件时实际上将HTML编码为RTF)。我们使用RDO库来解析msg文件并提取HTML正文。
RDO产生的一些HTML并不总是与Outlook显示相同(文本大小有时不匹配等)。
是否有人知道HTML正文提取的实现最接近Outlook显示的HTML外观,或者这是不可能的?
答案 0 :(得分:0)
更多的想法而不是答案...
您是否在浏览器中显示提取的主体,例如IE? 我希望问题是Outlook(2007)使用Word呈现引擎显示HTML,而浏览器使用自己的。所以,我认为你不太可能找到一个有用的提取实现 您可以将样式表应用于提取的正文文档,这将覆盖大多数不一致吗?