我需要用python语言编写代码,以便使用指纹技术比较文档文本。我不知道采取文件的指纹或生成文件的指纹。我问是否有人知道这个方法或者有源代码来生成以位形式存储的文档指纹。
答案 0 :(得分:4)
如果您需要message digests(加密哈希),请使用hashlib库。这是一个示例(IPython会话):
In [1]: import hashlib In [2]: md = hashlib.sha256(open('/tmp/Calendar.xls', 'rb').read()) In [3]: md.hexdigest() Out[3]: '8517f1eae176f1a20de78d879f81f23de503cfd6b8e4be1d798fb2342934b187'
答案 1 :(得分:4)
您可以尝试以下论文开始使用指纹识别的概念: