我正在尝试检查外语电子邮件的主题以进行自动测试。我遇到了编码问题所以我决定尝试写一些处理主题编码的东西。在这种情况下,它是在base64中给我的。将其转换为utf-8然后解码它会产生这种奇怪的双字符问题。这是我用来测试这个的一些代码:
import base64
ja_str = "こんにちは"
encoded_js = base64.b64encode(ja_str.encode())
print (encoded_js)
print(base64.b64decode(encoded_js).decode())
以上结果是:
b'44GT44KT44Gr44Gh44Gv'
ここんんににちちはは