如何从webimg文件中提取HTML文件?

时间:2019-07-18 19:56:47

标签: python html web router webimage

我在互联网上搜索了从路由器固件文件中提取网页的方法 我找到了这个python脚本,但是它给了我这个错误

  

回溯(最近一次通话最后一次):文件“ 1.py”,第15行,在       dest.write(img.read(int(length)))文件“ Python \ Python37-32 \ lib \ encodings \ cp1252.py”,   第19行,编码       返回codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError:“ charmap”编解码器无法在其中编码字符“ \ x89”   位置60560:字符映射到<undefined>

包含页面的文件

webimg & webidx

python脚本

import os

with open('webimg', encoding="latin_1") as img:
    with open('webidx') as idx:
        for line in idx:
            line = line.strip()
            if line.startswith('path:'):
                path = line[5:]
                os.makedirs(path)
            else:
                (filename, length, offset) = line.split()
                filepath = "%s/%s" % (path, filename)
                with open(filepath, 'w') as dest:
                    img.seek(int(offset))
                    dest.write(img.read(int(length)))

and when i tried the fix from the answer

它给了我这个错误

  

1.py”,第15行,在       dest.write(img.read(int(length)))文件“ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ codecs.py”,   第322行,处于解码状态       (结果,已消耗)= self._buffer_decode(data,self.errors,final)UnicodeDecodeError:'utf-8'编解码器无法解码位置的字节0xa8   42052:无效的起始字节

0 个答案:

没有答案