标签: python ms-word python-docx
我正在尝试提取Word docx文档中所有编号列表的标题。编号列表已用Word格式化,因此当您按回车键时,它将添加下一个编号。我不知道如何隔离编号列表。
例如,在下面我要提取: 这是header1
这是标题2
这是header2.1
谢谢。
————————————-
这是标题
这是header1
- Some text
2.1这是header2.1