UnicodeDecodeError:'charmap'编解码器无法解码位置599中的字节0x8f

时间:2018-03-05 11:05:41

标签: python ms-word

我的问题是,我想从word文档中提取一些行。 因此,我尝试了一些方法,这是我目前的计划:

a = open("Z:/xyz/xyz/xyz/test.docx","r")
b = a.readlines()
a.close()

count = 0
for line in b:
    count += 1
    if count == 3:
        print(line)

我总是得到我拒绝的UnicodeDecodeError作为这篇文章的标题。 即使我尝试“encoding =”utf-8“,我得到另一个错误称为”'utf-8'编解码器无法解码位置14中的字节0xfb“ 或者使用“encoding ='Latin-1'”将一些奇怪的数字作为输出。

1 个答案:

答案 0 :(得分:0)

您可以使用'b'以二进制模式打开文件。

with open("D:/xyz/xyz.docx",'rb') as f:
    b = f.readline()

count = 0
for line in b:
    count += 1
    if count == 3:
        print(line)