PHP DOM保留Html结构

时间:2013-02-09 00:37:49

标签: php dom

我有这段代码

 $strhtml = file_get_contents('05001400300320100033100.html');
 $dochtml = new DOMDocument();
 $dochtml->loadHTML($strhtml);
 $elm = $dochtml->getElementById('upPanelActuciones');
 $tag = $elm->tagName;
 $cnt = $elm->nodeValue;
  echo $tag. ' - '. $cnt; 

所以......我得到了这个:

Detalle德尔Registro DATOS德尔ProcesoInformaciónRadicación德尔Proceso Despacho波南特003 JUZGADO市政 - 民用JUEZ TERCERO土木工程市政Clasificación德尔Proceso TIPO CLASE RECURSOUbicación德尔Expediente德EjecuciónEjecutivo的奇异SIN TIPO DE RECURSO档案馆Contenido德RadicaciónDemandante(多个)Demandado (s)Â3354216 - HORACIO DE JESUS JIMENEZ ARANGO 70128088 - RAFAEL ANGEL HERNANDEZ OROZCO Contenido Actuaciones del Proceso FechadeActuaciónActuaciónAnotaciónFechaIniciaTé©rmino Fecha FinalizaTérmino Fecha de Registro 2011年11月18日ARCHIVO DEFINITIVO CAJA 267 18 Nov 2011 2010年9月27日RECEPCIÓN MEMORIAL OJ F2 2010年9月21日2010年9月21日RECEPCIÔN MEMORIAL OJ F1 2010年9月21日2010年5月10日RETIRO DEMANDA - ART.88 PEDRO NEL OSPINA 2010年5月10日2010年5月03日FIJACIONESTADOACTUACIÓN REGISTRADA EL 03 / 05/2010 A LAS 11:32:40 2010年5月5日2010年5月5日2010年5月3日2010年5月3日汽车RECHAZA DEMANDA T.4 2010年5月7日2010年4月7日RADICACAÓN DEPROCESOACTORACIÔNDERADICACIÓN DE PROCESO REALIZADA EL 07/04/2010 A LAS 17:54 :2010年4月7日2010年4月7日2010年4月7日

只是一个纯文本。

所以,我的问题是:有没有办法保留Html结构,我的意思是“upPanelActuciones”中的Td和Tr或我想要的任何其他标签或属性?

提前感谢您的帮助!

1 个答案:

答案 0 :(得分:2)

那是因为nodeValue属性只能获取该节点的文本内容。

请改用saveXml()方法:

$elm = $dochtml->getElementById('upPanelActuciones');

print $dochtml->saveXml($elm);