我正在尝试将Base64解码为Hex以获得大约200个Base64数据,我收到此错误消息。它解码60个然后停止。
ABHvPdSaxrhjAWA=
0011ef3dd49ac6b8630160
ABHPdSaxrhjAWA=
Traceback (most recent call last):
File "tt.py", line 36, in <module>
csvlines[0] = csvlines[0].decode("base64").encode("hex")
File "C:\Python27\lib\encodings\base64_codec.py", line 43, in base64_decode
output = base64.decodestring(input)
File "C:\Python27\lib\base64.py", line 325, in decodestring
return binascii.a2b_base64(s)
binascii.Error: Incorrect padding
CSV中的一些原始Base64源
ABHPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdS4xriiAVQ=
ABDPdSqxrizAU4=
ABDPdSrxrjPAUo=
答案 0 :(得分:5)
CSV文件中至少有一个字符串不是Base64字符串,是损坏的(损坏的)Base64字符串,或者是缺少必需的=
填充的字符串。您的示例值ABHPdSaxrhjAWA=
很短=
或缺少其他数据字符。
正确填充的Base64字符串的长度是4的倍数,因此您可以轻松地重新添加填充:
value = csvlines[0]
if len(value) % 4:
# not a multiple of 4, add padding:
value += '=' * (4 - len(value) % 4)
csvlines[0] = value.decode("base64").encode("hex")
如果仍然的值无法解码,那么您的输入已损坏或无效的Base64开始。
对于示例错误ABHPdSaxrhjAWA=
,上面添加了一个=
以使其可解码:
>>> value = 'ABHPdSaxrhjAWA='
>>> if len(value) % 4:
... # not a multiple of 4, add padding:
... value += '=' * (4 - len(value) % 4)
...
>>> value
'ABHPdSaxrhjAWA=='
>>> value.decode('base64')
'\x00\x11\xcfu&\xb1\xae\x18\xc0X'
>>> value.decode('base64').encode('hex')
'0011cf7526b1ae18c058'
我需要强调一下,您的数据可能会被破坏。您的控制台输出包括一个有效的值和一个失败的值。有效的是一个字符更长,这是唯一差异:
ABHvPdSaxrhjAWA=
ABHPdSaxrhjAWA=
注意第4位的v
;这是第二个例子中缺少的。这可能表示您的CSV数据发生了某些事情,导致该字符从第二个示例中删除。添加填充可以使第二个值再次解码,但结果将是错误。我们无法告诉你这两个选项中的哪一个是原因。