我具有读取文件docx
到XML字符串的功能
function DocxToXML($docx){
$zip = new ZipArchive;
$xml = new DOMDocument();
if (true === $zip->open($docx)) {
if (($index = $zip->locateName('word/document.xml')) !== false) {
$data = $zip->getFromIndex($index);
$xml->loadXML($data, LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING);
return $xml->saveXML();
$zip->close();
}
}
}
部分输出是这样的:
<w:p w14:paraId="3B9C178C" w14:textId="3CA29A42" w:rsidR="009D1831" w:rsidRDefault="001D238C" w:rsidRPr="00140DC0">
<w:pPr>
<w:rPr>
<w:b/>
</w:rPr>
</w:pPr>
<w:r w:rsidRPr="00140DC0">
<w:rPr>
<w:b/>
</w:rPr>
<w:t>H</w:t>
</w:r>
<w:r w:rsidR="00A25F3E" w:rsidRPr="00140DC0">
<w:rPr>
<w:b/>
</w:rPr>
<w:t>ello</w:t>
</w:r>
<w:r w:rsidRPr="0077647F">
<w:t xml:space="preserve">world</w:t>
</w:r>
</w:p>
在.docx
文件中,例如=> 你好单词
如何处理从标记<w:p>...<w:p>
用内联样式将xml字符串转换为html代码