我试图通过使用python中的gz
库从网站获取Requests
文件。
我的代码:
import zlib
import requests
if __name__ == '__main__':
session = requests.Session()
url_response = session.get(<URL>)
decompressed_data = zlib.decompress(url_response.content, 16 + zlib.MAX_WBITS)
现在我得到的解压缩值是字符和字节的混合,
但我想将所有流解码为“ UTF-16”(当我在当前字符串上执行此操作时,我得到了无法识别的字符)。
我的想法是编码为字节并解码为“ UTF-16”,但是我不确定这样做是否可行或正确。
希望有人可以帮助我解决这个问题,谢谢
已解决
文件编码为“ UTF-8 Unicode(带BOM)文本,带有CRLF行终止符”,因此我将字节流解码为“ utf-8-sig”