我想从docx文件中读取标题但是文档模块没有读取标题的属性我怎么能这样做
from docx import Document
def docheading():
document = Document('C://Users//yousafzai//Desktop//Database//riya//riya//AbdulMateen.docx')
headings=document.heading
答案 0 :(得分:0)
尝试使用其他库,例如paradocx,它可以使用类似style='Heading 1'
答案 1 :(得分:0)
我有点做同样的事情。我做了类似这样的事情,你要找的是Style.name
for paragraph in paragraphs:
if paragraph.style.name=='Heading 1':
print (paragraph.text)
答案 2 :(得分:0)
这是提取标题的方法:
for paragraph in document.paragraphs:
if paragraph.style.name=='Title':
doc_title = paragraph.text