标签: python ms-word doc
我试图从.doc文件中读取文本,但它似乎只返回一些有关该文件的十六进制信息。
这是我的IDE:
>>> output = open('letterlegal5.doc') >>> output.read() '\xd0\xcf\x11\xe0\xa1\xb1'
这些信息是什么以及如何将文件转换为可读文本?