我试图在python 2.7中构建加密程序。它将从文件中读取二进制文件,然后使用密钥对其进行加密。但是,我很快遇到了问题。图像文件和可执行文件等文件读取为十六进制值。但是,文本文件不使用open()。即使我跑
file = open(“myfile.txt”,“rb”)
出= file.read()
它仍然只是文字。我在Windows 7上,而不是Linux,我认为可能会有所作为。有什么方法可以从任何文件(包括文本文件)读取二进制文件,而不仅仅是图像和可执行文件?
答案 0 :(得分:2)
即使在使用'rb'标志读取文件时, 如果您的文件具有字节'\ x41',它将在控制台中打印为字母'A'。 如果需要十六进制值,请将文件内容编码为十六进制,这意味着:
content = open('text.txt', 'rb').read()
hex = content.encode('hex')
答案 1 :(得分:1)
看看下面的代码。还有很多要点
from hashlib import md5
from Crypto.Cipher import AES
from Crypto import Random
def derive_key_and_iv(password, salt, key_length, iv_length):
d = d_i = ''
while len(d) < key_length + iv_length:
d_i = md5(d_i + password + salt).digest()
d += d_i
return d[:key_length], d[key_length:key_length+iv_length]
def encrypt(in_file, out_file, password, key_length=32):
bs = AES.block_size
salt = Random.new().read(bs - len('Salted__'))
key, iv = derive_key_and_iv(password, salt, key_length, bs)
cipher = AES.new(key, AES.MODE_CBC, iv)
out_file.write('Salted__' + salt)
finished = False
while not finished:
chunk = in_file.read(1024 * bs)
if len(chunk) == 0 or len(chunk) % bs != 0:
padding_length = (bs - len(chunk) % bs) or bs
chunk += padding_length * chr(padding_length)
finished = True
out_file.write(cipher.encrypt(chunk))
def decrypt(in_file, out_file, password, key_length=32):
bs = AES.block_size
salt = in_file.read(bs)[len('Salted__'):]
key, iv = derive_key_and_iv(password, salt, key_length, bs)
cipher = AES.new(key, AES.MODE_CBC, iv)
next_chunk = ''
finished = False
while not finished:
chunk, next_chunk = next_chunk, cipher.decrypt(in_file.read(1024 * bs))
if len(next_chunk) == 0:
padding_length = ord(chunk[-1])
chunk = chunk[:-padding_length]
finished = True
out_file.write(chunk)
用法
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
encrypt(in_file, out_file, password)
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
decrypt(in_file, out_file, password)
答案 2 :(得分:1)
您的二进制文件看起来像文本,因为文件被视为以8位编码(ASCII或Latin-1等)编码。此外,在Python 2中,字节和(文本)字符可以互换使用...即字符串只是一个ASCII字节数组。
你应该搜索python 2和3文本编码之间的差异,你会很快发现为什么会遇到异常现象。大多数Python 2版本的加密模块都使用python字节字符串。
您的“二进制”非文本文件实际上与文本文件没有任何不同;它们只是不映射到您识别的可理解编码,而文本执行。