Docx段落unicode

时间:2016-07-20 14:39:44

标签: python-2.7 python-docx

我正在使用python 2.7.11 docx 0.8.6

我想从doc.paragraphs获取文本 当我的段落有波兰标志,如łąćśńźż等我得到错误(如果段落没有这样的迹象,它运作良好:

在change_doc_paragraph中

    print paragraph.text AttributeError:'unicode'对象没有属性'text'

如何解决这个问题?

@scanny这里有代码:

doc = docx.Document(<pathToDoc>)
for paragraph in doc.paragraphs:
    print paragraph.text

你的医生应该有一些迹象łŁĄąĘꌜĆ毿ŹźŃńÓó

1 个答案:

答案 0 :(得分:0)

您应首先声明编码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

然后输入:

u'łŁĄąĘꌜĆ毿ŹźŃńÓó'