Python将文本文件读为二进制文件?

时间:2015-05-31 22:01:21

标签: file python-2.7 encryption binary

我试图在python 2.7中构建加密程序。它将从文件中读取二进制文件,然后使用密钥对其进行加密。但是,我很快遇到了问题。图像文件和可执行文件等文件读取为十六进制值。但是,文本文件不使用open()。即使我跑

file = open(“myfile.txt”,“rb”)

出= file.read()

它仍然只是文字。我在Windows 7上,而不是Linux,我认为可能会有所作为。有什么方法可以从任何文件(包括文本文件)读取二进制文件,而不仅仅是图像和可执行文件?

3 个答案:

答案 0 :(得分:2)

即使在使用'rb'标志读取文件时, 如果您的文件具有字节'\ x41',它将在控制台中打印为字母'A'。 如果需要十六进制值,请将文件内容编码为十六进制,这意味着:

content = open('text.txt', 'rb').read()
hex = content.encode('hex')

答案 1 :(得分:1)

看看下面的代码。还有很多要点

from hashlib import md5
from Crypto.Cipher import AES
from Crypto import Random

def derive_key_and_iv(password, salt, key_length, iv_length):
    d = d_i = ''
    while len(d) < key_length + iv_length:
        d_i = md5(d_i + password + salt).digest()
        d += d_i
    return d[:key_length], d[key_length:key_length+iv_length]

def encrypt(in_file, out_file, password, key_length=32):
    bs = AES.block_size
    salt = Random.new().read(bs - len('Salted__'))
    key, iv = derive_key_and_iv(password, salt, key_length, bs)
    cipher = AES.new(key, AES.MODE_CBC, iv)
    out_file.write('Salted__' + salt)
    finished = False
    while not finished:
        chunk = in_file.read(1024 * bs)
        if len(chunk) == 0 or len(chunk) % bs != 0:
            padding_length = (bs - len(chunk) % bs) or bs
            chunk += padding_length * chr(padding_length)
            finished = True
        out_file.write(cipher.encrypt(chunk))

def decrypt(in_file, out_file, password, key_length=32):
    bs = AES.block_size
    salt = in_file.read(bs)[len('Salted__'):]
    key, iv = derive_key_and_iv(password, salt, key_length, bs)
    cipher = AES.new(key, AES.MODE_CBC, iv)
    next_chunk = ''
    finished = False
    while not finished:
        chunk, next_chunk = next_chunk, cipher.decrypt(in_file.read(1024 * bs))
        if len(next_chunk) == 0:
            padding_length = ord(chunk[-1])
            chunk = chunk[:-padding_length]
            finished = True
        out_file.write(chunk)

用法

with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
    encrypt(in_file, out_file, password)
with open(in_filename, 'rb') as in_file, open(out_filename, 'wb') as out_file:
    decrypt(in_file, out_file, password)

答案 2 :(得分:1)

您的二进制文件看起来像文本,因为文件被视为以8位编码(ASCII或Latin-1等)编码。此外,在Python 2中,字节和(文本)字符可以互换使用...即字符串只是一个ASCII字节数组。

你应该搜索python 2和3文本编码之间的差异,你会很快发现为什么会遇到异常现象。大多数Python 2版本的加密模块都使用python字节字符串。

您的“二进制”非文本文件实际上与文本文件没有任何不同;它们只是不映射到您识别的可理解编码,而文本执行