我正在尝试从数据库导出一些CKEditor创建的xhtml字段,将它们转换为docx,在Word中编辑文档,然后将其转换回xhtml并将这些字段导回数据库。我目前正在使用docx4j-XHTMLImport,但我愿意接受建议。
xhtml结构如下:
<html><body>
<div id="database-field-1" class="field-section">
<label>database-field-1</label>
<div class="field-content">xyz</div>
</div>
<div id="database-field-2" class="field-section">
<label>database-field-2</label>
<div class="field-content">xyz</div>
</div>
等...
因此,在格式之间进行转换时,我希望保留div中的id,所以当我再次导入时,我可以解析xhtml并提取每个id的字段来更新数据库。
谢谢!