我在工作中遇到问题,我尝试使用 python3
读取.doc文件但我收到错误:
UnicodeDecodeError: 'gb2312' codec can't decode byte ....: illegal multibyte sequence
我尝试了很多解码类型,utf-8,GBK,utf-16 ......但每种解码类型都给我相同的结果,所有这些都是乱码,但我可以通过Microsoft Word正常打开文件,并且所有信息在文件显示中,我想该文件使用的是我不知道或者出错的解码类型?在这种情况下你能给我一些建议吗?
感谢您的阅读!