标签: email storage deduplication
建议的存储模型是将附件存储在单独的文件(或blob)中,并将电子邮件本身存储为MIME多部分邮件,引用附加文件及其编码方式。这允许用户显示原始,但不要求我实际存储效率较低的base64和消息。大多数情况下,我只能存储使用的base64行长度。
这样,我们就可以执行附件级重复数据删除。
但重复数据删除如何进一步发展?以下是我的想法:
您对此领域有什么建议吗?电子邮件存储系统的正常情况是什么?