我需要在linux上的python进程之间高效地传输二进制数据。但是我找不到通过管道传递它的方法。我最接近的是将其作为字符串传递,但是由于某种原因它保留了二进制形式,因此给我带来了麻烦。
ciphertext, tag = cipher1.encrypt_and_digest(input().encode())
print(ciphertext)
密文是二进制的,但是当我在其他进程中测试它的类型时
print(type(sys.stdin.read()))
我明白了
<class 'str'>
有什么想法吗?
答案 0 :(得分:5)
在Python 3中,您不能对二进制数据使用print
或input
。它们是为处理文本(Unicode)而不是二进制文件而设计的。您可以对.write
和.read
使用文件sys.stdout.buffer
和sys.stdin.buffer
调用,它们是stdin和stdout的基础二进制缓冲区。您不能使用sys.stdout
和sys.stdin
,因为它们是用于文本的。 docs for sys.stdin and sys.stdout的末尾有一个简短的注释。
这是一个简短的演示。
在“ send_bytes.py”中,我们创建一个包含所有可能的字节值的bytes
字符串data
并将其写入sys.stdout.buffer
。我们将该输出通过管道传输到“ get_bytes.py”中进行读取,并检查以确保在正确的位置具有所有正确的字节。
#! /usr/bin/env python3
''' Write some binary data to stdout '''
import sys
# Make a bytes string containing all possible byte values
data = bytes(range(256))
#Send it as binary to stdout
out = sys.stdout.buffer
out.write(data)
#! /usr/bin/env python3
''' Read some binary data from stdin '''
import sys
#Read binary data from stdin
infile = sys.stdin.buffer
newdata = infile.read()
print(newdata)
# Make a bytes string containing all possible byte values
data = bytes(range(256))
#Check that the read data is correct
print(newdata == data)
我们使用以下命令行运行程序:
$ python3 ./send_bytes0.py | python3 ./get_bytes0.py
这是“ get_bytes0.py”打印的输出
b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'
True