VBA Word:如何将内容与格式信息分开?

时间:2013-04-28 06:38:56

标签: ms-word word-vba

我正在尝试编写一个VBA宏,它将给定的MS word文档转换为该文档中包含的文档对象的顺序列表(例如,段落,表格等)。对于每个对象,我想提取包含的文本及其显式格式信息,以将其保存在数据库中。

对我有什么指示如何开始?这个文档解析任务有没有优雅的解决方案?

1 个答案:

答案 0 :(得分:1)

如果不了解您的全部要求,这只是一些建议。

你可能能够做你想做的事情,但拉开单词文档并将它们重新组合在一起将是一项巨大的任务。如果您不愿意采用这种方法,最好的方法是提取段落,图像等,并将这些部分保存为数据库中的单个文档。然后可以使用

将它们放回原处
For i = 1 To ActiveDocument.Paragraphs.Count

 MsgBox ActiveDocument.Paragraphs.Item(i)


Next i


ActiveDocument.Content.InsertAfter AnotherDocument

这是非常基本的,并且将有很多工作要正常工作。

我想知道将文档转换为html会更好(仅通过保存为HTML),然后您可以使用开源库来允许用户编辑文档的某些部分。例如,为jquery添加jeditable插件,几乎html word文档中的任何段落都可以编辑。一个简单的后端PHP脚本来保存更改,你有一些有用的东西。然后,您还可以记录为翻译目的而改变的内容。

他们的文档可以在发送给客户之前保存为word docs或pdf

只是一个想法。