有谁知道如何构建维基百科转储中的sha1总和?我刚刚发现:"这些包含的信息,如每个修订文本的sha1总和......" (http://meta.wikimedia.org/wiki/Data_dumps/Dump_format)
但是当我尝试计算任何修订文本的总和时,我从来没有得到相同的总和。所以我想也许会有更多影响这个价值的东西。我在" text" -tags之间取了所有文本。 感谢
答案 0 :(得分:1)
sha1sum从hex-转换为base36-number,它只是<text></text>
-tags之间的revisiontext。感谢MaxSem!