Question

我正在尝试将Base64解码为Hex以获得大约200个Base64数据，我收到此错误消息。它解码60个然后停止。

ABHvPdSaxrhjAWA=
0011ef3dd49ac6b8630160
ABHPdSaxrhjAWA=
Traceback (most recent call last):
  File "tt.py", line 36, in <module>
    csvlines[0] = csvlines[0].decode("base64").encode("hex")
  File "C:\Python27\lib\encodings\base64_codec.py", line 43, in base64_decode
    output = base64.decodestring(input)
  File "C:\Python27\lib\base64.py", line 325, in decodestring
    return binascii.a2b_base64(s)
binascii.Error: Incorrect padding

CSV中的一些原始Base64源

ABHPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdSaxrhjAWA=
ABDPdS4xriiAVQ=
ABDPdSqxrizAU4=
ABDPdSrxrjPAUo=

Answer 1

CSV文件中至少有一个字符串不是Base64字符串，是损坏的（损坏的）Base64字符串，或者是缺少必需的=填充的字符串。您的示例值ABHPdSaxrhjAWA=很短= 或缺少其他数据字符。

正确填充的Base64字符串的长度是4的倍数，因此您可以轻松地重新添加填充：

value = csvlines[0]
if len(value) % 4:
    # not a multiple of 4, add padding:
    value += '=' * (4 - len(value) % 4) 
csvlines[0] = value.decode("base64").encode("hex")

如果仍然的值无法解码，那么您的输入已损坏或无效的Base64开始。

对于示例错误ABHPdSaxrhjAWA=，上面添加了一个=以使其可解码：

>>> value = 'ABHPdSaxrhjAWA='
>>> if len(value) % 4:
...     # not a multiple of 4, add padding:
...     value += '=' * (4 - len(value) % 4)
...
>>> value
'ABHPdSaxrhjAWA=='
>>> value.decode('base64')
'\x00\x11\xcfu&\xb1\xae\x18\xc0X'
>>> value.decode('base64').encode('hex')
'0011cf7526b1ae18c058'

我需要强调一下，您的数据可能会被破坏。您的控制台输出包括一个有效的值和一个失败的值。有效的是一个字符更长，这是唯一差异：

ABHvPdSaxrhjAWA=
ABHPdSaxrhjAWA=

注意第4位的v;这是第二个例子中缺少的。这可能表示您的CSV数据发生了某些事情，导致该字符从第二个示例中删除。添加填充可以使第二个值再次解码，但结果将是错误。我们无法告诉你这两个选项中的哪一个是原因。

使用Python

1 个答案: