我希望用户能够上传word文档,然后我的程序将文档解析为单独的word文档。问题是拆分需要手动,因为所有word文档的格式都不一样。我最初的想法是在用户上传之前,用户使用开始和结束标记(某种类型可能是注释)标记这些部分,然后我的程序可以解析并将文档拆分成单独的文档。 (这也需要适用于.doc和.docx,因此需要一个通用的解决方案)
实施例。输入:
文档1
第1章
Blah Blah Blah第2章
Blah blah
/ end Doc1
实施例。输出:
文档1
第1章
Blah Blah Blah/ end Doc1
Doc 2
第2章
Blah blah
/ end Doc2
有什么想法吗?我一直在努力解决这个问题
答案 0 :(得分:4)
你想做的事情是非平凡的!我已经完成了公平的文档操作,如果你现在正在使用DOCX,那么由于支持库的原因,它不是太糟糕,请参阅:
旧版本变得更加困难,您需要为此获取库,或者建议使用宏。
“程序”是一个网站吗?如果是这样,请确保不使用COM互操作!
答案 1 :(得分:0)
我想说最好的办法就是调查VSTO或VBA宏来实现这一目标。无论文档是什么版本,两者都可以完全访问对象模型。
答案 2 :(得分:0)
HTML Transit可能有所帮助。它是一个令人难以置信的旧软件,而且价格非常昂贵,从初始搜索开始,它可能不再受支持了。但是,它确实能够获取一个Word文档,并将其拆分为更小的部分(当然,它也将其转换为HTML)。也许是要调查的东西。谷歌“HTML Transit”用于更多研究和免费演示。
答案 3 :(得分:0)
我使用Aspose.Words在文档操作和生成方面取得了巨大成功。
答案 4 :(得分:0)
VBA宏将文件拆分为子文档
Sub UpdateDocuments()
Application.ScreenUpdating = False
Dim strFolder As String, strFile As String, wdDoc As Document
strFolder = GetFolder
If strFolder = "" Then Exit Sub
strFile = Dir(strFolder & "\*.doc", vbNormal)
While strFile <> ""
Set wdDoc = Documents.Open(FileName:=strFolder & "\" & strFile, AddToRecentFiles:=False, Visible:=False)
With wdDoc
'Call your other macro or insert its code here
'BreakOnSection
wdDoc.Activate
ActiveDocument.ActiveWindow.View.Type = wdOutlineView
Selection.WholeStory
Selection.Copy
ActiveDocument.Subdocuments.AddFromRange Range:=Selection.Range
ActiveDocument.SaveAs "C:\Data\Split\" & ActiveDocument.Name
ActiveDocument.Close SaveChanges:=True
End With
strFile = Dir()
Wend
Set wdDoc = Nothing
Application.ScreenUpdating = True
End Sub
Function GetFolder() As String
Dim oFolder As Object
GetFolder = ""
Set oFolder = CreateObject("Shell.Application").BrowseForFolder(0,
"Choose a folder", 0)
If (Not oFolder Is Nothing) Then GetFolder = oFolder.Items.Item.Path
Set oFolder = Nothing
End Function