使用phpdocx将Docx转换为HTML

时间:2012-08-05 03:01:28

标签: php xml xml-parsing ms-word

我在将.docx转换为HTML时遇到了麻烦...... 我正在使用PHPDOCX FREE来处理这个问题...... 我有一些问题,我能够确定问题出在哪里.. 它出现在下一段代码中:

$xmlDOM = new DOMDocument();
$xml = str_replace('</w:wordDocument>', '', $xml);
$xml = preg_replace(
  '/(<w:wordDocument)+(.)*(><w:body>)/', '<w:body>', $xml
 );

特别是'preg_replace'函数... 它使服务器如此繁忙...所以在我重新启动服务器之前我无法工作......

1 个答案:

答案 0 :(得分:1)

尝试替换它:

$xml = preg_replace(
  '/(<w:wordDocument)+(.)*(><w:body>)/', '<w:body>', $xml
 );

由此:

$xml = preg_replace(
  '/<w:wordDocument.*?><w:body>/', '<w:body>', $xml
 );

或者只是(如果wordDocument标签总是由body标签表示):

$xml = preg_replace(
  '/<w:wordDocument.*?>/', '', $xml
 );

使用括号使php使用更多的mamory。 您有PHP版本吗?