如何将HTML片段转换为WordProcessingML?

时间:2018-09-06 16:02:53

标签: c# openxml wordprocessingml

问题

是否有一种方法可以将HTML格式的文本直接转换为WordML格式,而不是整个文档格式?

原因

我需要用与这些占位符相对应的各种HTML片段(即手动实现的书签)替换现有docx文档中的占位符。 HTML片段是使用我们的Web应用程序上的HTML控件(TinyMCE)创建的。

HTML包含基本元素,例如段落,标题列表等,例如

<h1>A heading</h1
<p>first paragraph</p>
<ul> 
<li>Item 1</li> 
<li>Item 2</li>
</ul>
<p>second paragraph</p>

我正在使用Flat Document code来实现替换,效果很好,但是显然可以将现有的占位符替换为解释为纯文本的HTML。

我需要做的是将HTML标记转换为相应的WordML标记(因此H1变为Heading 1等),然后将该docx文件样式化以用于那些新插入的转换元素。

我尝试过的方法似乎无效

因为我不想使用单独的css文件,并且由于要替换很多单独的占位符,并且在现有docx文件中的静态内容中穿插了一些内容,因此似乎无法使用AltChunk {{1 }}方法,通过该方法可以创建文档的单独HTML部分(例如,AltChunk方法是this existing question中的方法,也称为discussed on Eric White's blog here

而且因为我没有转换整个文件,该文件似乎也算不上OpenXMLPowerTools HTMLToWMLConverter方法。

关于此问题,目前存在几个问题,但是它们要么都在谈论如何转换整个文档,要么是use the AddAlternativeFormatImportPath approach,或者现在已经很老了。

0 个答案:

没有答案