使用python从docx文件中读取标题

时间:2015-01-30 20:17:45

标签: python-2.7 docx

我想从docx文件中读取标题但是文档模块没有读取标题的属性我怎么能这样做

from docx import Document
def docheading():
    document = Document('C://Users//yousafzai//Desktop//Database//riya//riya//AbdulMateen.docx')
    headings=document.heading

3 个答案:

答案 0 :(得分:0)

尝试使用其他库,例如paradocx,它可以使用类似style='Heading 1'

的内容从Office XML规范中读取paradata

答案 1 :(得分:0)

我有点做同样的事情。我做了类似这样的事情,你要找的是Style.name

for paragraph in paragraphs:
    if paragraph.style.name=='Heading 1':
        print (paragraph.text)

答案 2 :(得分:0)

这是提取标题的方法:


for paragraph in document.paragraphs:
    if paragraph.style.name=='Title':
        doc_title = paragraph.text