现在,我可以分别阅读表格和标题。有没有办法在Word文档中使用Python读取表格及其相应的标题。现在,我使用python-docx来读取表格和标题。
有关表结构和标题的更多信息,请参见下图。我无法读取表格标题[表格标题&子标题]和表格。
答案 0 :(得分:0)
在你的问题中没有说明,但我想你的问题是如何按照它们出现的顺序(文档顺序)迭代文档中的两个段落和表格。
这个问题和一些解决方案在这个GitHub问题中讨论:
https://github.com/python-openxml/python-docx/issues/40
和这一个:
https://github.com/python-openxml/python-docx/issues/276
它也出现在其他StackOverflow问题中:
Retrieve document content with document structure with python-docx