读取.zip文件中的文件名

时间:2017-10-01 23:32:03

标签: unicode utf-8 zipfile

我熟悉.zip文件格式,到目前为止能够读取内部文件表内容。

文件名中包含非英文字符会出现问题。

规范声明文件名使用OEM字符集,但有时我会获得UTF-8表示,有时我会获得OEM represantation。

规范声明“由...制作的版本”应在0-20范围内,但我得到的版本31和63可能会影响字符集,也可能不会影响字符集。

另一个相关的问题:当我读取“额外字段”时,有“up”(unicode路径,id = 0x7075),它假设存储文件名的utf-8重新定位,好吧,它以5个冗余字节开始实际的utf-8字符串(由WinRar创建),但其他软件似乎正确读取它。

有关此问题的任何意见?

0 个答案:

没有答案