这是一个有趣的问题,我对该领域的现有解决方案或研究不太了解,但我认为它与压缩领域有关。
鉴于两个可能很大的文本字符串,其中一个代表前者的更高版本,是否有可能(我知道它可能,我要求的确有现有解决方案)来比较这两个字符串并将它们减少到一组差异,以后可用于确定性地重建原始字符串?
就我而言,我有兴趣存储最新版本的字符串,但保留“压缩”(差异)历史备份,可以根据需要进行恢复,而不必实际存储所有重复的信息。
我不知道该如何标记,请帮帮我。
答案 0 :(得分:4)
CLR中没有支持差异化的内置类。
相关问题似乎有有用的信息(即Creating Delta Diff Patches of large Binary Files in C#)。您还可以查看“Delta编码”搜索(即http://en.wikipedia.org/wiki/Delta_encoding)。