从C#

时间:2019-05-21 14:20:37

标签: c# parsing docx

我有一个带有测试和缩进标题的Word文档(标题为1,标题为2等)

我想提取所有这些标题和字幕的目录。我不太在乎层次结构(尽管会很好)

到目前为止,我已经添加了DocX by Exceed Nuget来打开DocX(尽管我需要打开ImX来使用其他库),并且我可以使用:DocX document = DocX.Load(File.OpenRead(path));

加载文件

我可以使用一种标题样式来获得所有部分,例如:

 public void Load(string path)
        {
            if(File.Exists(path))
            {
                DocX document = DocX.Load(File.OpenRead(path));
                document.Paragraphs.Where(x => x.StyleName == "Heading3").ToList();

                 ;
            }
        }

但是我得到的文本没有编号..而这正是我所需要的。

有个喜欢的话:

1 Main text
 1.1 Subtest 1
 1.1.1 Details
 1.2 SubText 2

我之前写过的行为我提供了"Main text, Subtext1, Details, ...",但我丢失了编号。.如何从DocX文档中的pragraph节点推断编号? ?

0 个答案:

没有答案