我需要在python中编写代码,用于使用指纹技术比较两个文档的文本

时间:2008-09-18 09:25:30

标签: python diff

我需要用python语言编写代码,以便使用指纹技术比较文档文本。我不知道采取文件的指纹或生成文件的指纹。我问是否有人知道这个方法或者有源代码来生成以位形式存储的文档指纹。

2 个答案:

答案 0 :(得分:4)

如果您需要message digests(加密哈希),请使用hashlib库。这是一个示例(IPython会话):

 In [1]: import hashlib

 In [2]: md = hashlib.sha256(open('/tmp/Calendar.xls', 'rb').read())

 In [3]: md.hexdigest()
 Out[3]: '8517f1eae176f1a20de78d879f81f23de503cfd6b8e4be1d798fb2342934b187'

答案 1 :(得分:4)

您可以尝试以下论文开始使用指纹识别的概念: