我有一个带有测试和缩进标题的Word文档(标题为1,标题为2等)
我想提取所有这些标题和字幕的目录。我不太在乎层次结构(尽管会很好)
到目前为止,我已经添加了DocX by Exceed
Nuget来打开DocX(尽管我需要打开ImX来使用其他库),并且我可以使用:DocX document = DocX.Load(File.OpenRead(path));
我可以使用一种标题样式来获得所有部分,例如:
public void Load(string path)
{
if(File.Exists(path))
{
DocX document = DocX.Load(File.OpenRead(path));
document.Paragraphs.Where(x => x.StyleName == "Heading3").ToList();
;
}
}
但是我得到的文本没有编号..而这正是我所需要的。
有个喜欢的话:
1 Main text
1.1 Subtest 1
1.1.1 Details
1.2 SubText 2
我之前写过的行为我提供了"Main text, Subtext1, Details, ..."
,但我丢失了编号。.如何从DocX文档中的pragraph节点推断编号? ?