将Word文档拆分为较小的文档

时间:2010-02-18 22:23:38

标签: c# .net ms-word

我希望用户能够上传word文档,然后我的程序将文档解析为单独的word文档。问题是拆分需要手动,因为所有word文档的格式都不一样。我最初的想法是在用户上传之前,用户使用开始和结束标记(某种类型可能是注释)标记这些部分,然后我的程序可以解析并将文档拆分成单独的文档。 (这也需要适用于.doc和.docx,因此需要一个通用的解决方案)

实施例。输入:

文档1

第1章

Blah Blah Blah

第2章

Blah blah

/ end Doc1

实施例。输出:

文档1

第1章

Blah Blah Blah

/ end Doc1

Doc 2

第2章

Blah blah

/ end Doc2

有什么想法吗?我一直在努力解决这个问题

5 个答案:

答案 0 :(得分:4)

你想做的事情是非平凡的!我已经完成了公平的文档操作,如果你现在正在使用DOCX,那么由于支持库的原因,它不是太糟糕,请参阅:

http://openxmldeveloper.org/

旧版本变得更加困难,您需要为此获取库,或者建议使用宏。

“程序”是一个网站吗?如果是这样,请确保使用COM互操作!

答案 1 :(得分:0)

我想说最好的办法就是调查VSTO或VBA宏来实现这一目标。无论文档是什么版本,两者都可以完全访问对象模型。

答案 2 :(得分:0)

HTML Transit可能有所帮助。它是一个令人难以置信的旧软件,而且价格非常昂贵,从初始搜索开始,它可能不再受支持了。但是,它确实能够获取一个Word文档,并将其拆分为更小的部分(当然,它也将其转换为HTML)。也许是要调查的东西。谷歌“HTML Transit”用于更多研究和免费演示。

答案 3 :(得分:0)

我使用Aspose.Words在文档操作和生成方面取得了巨大成功。

答案 4 :(得分:0)

VBA宏将文件拆分为子文档

Sub UpdateDocuments()

    Application.ScreenUpdating = False
    Dim strFolder As String, strFile As String, wdDoc As Document
    strFolder = GetFolder
    If strFolder = "" Then Exit Sub
    strFile = Dir(strFolder & "\*.doc", vbNormal)
    While strFile <> ""
        Set wdDoc = Documents.Open(FileName:=strFolder & "\" & strFile,      AddToRecentFiles:=False, Visible:=False)
        With wdDoc
            'Call your other macro or insert its code here
            'BreakOnSection
            wdDoc.Activate

        ActiveDocument.ActiveWindow.View.Type = wdOutlineView
            Selection.WholeStory
        Selection.Copy
            ActiveDocument.Subdocuments.AddFromRange Range:=Selection.Range
            ActiveDocument.SaveAs "C:\Data\Split\" & ActiveDocument.Name

            ActiveDocument.Close SaveChanges:=True
    End With
    strFile = Dir()
    Wend
    Set wdDoc = Nothing
    Application.ScreenUpdating = True
End Sub

Function GetFolder() As String
    Dim oFolder As Object
    GetFolder = ""
    Set oFolder = CreateObject("Shell.Application").BrowseForFolder(0,     

"Choose a folder", 0)
    If (Not oFolder Is Nothing) Then GetFolder = oFolder.Items.Item.Path
    Set oFolder = Nothing
End Function