我有这段代码
$strhtml = file_get_contents('05001400300320100033100.html');
$dochtml = new DOMDocument();
$dochtml->loadHTML($strhtml);
$elm = $dochtml->getElementById('upPanelActuciones');
$tag = $elm->tagName;
$cnt = $elm->nodeValue;
echo $tag. ' - '. $cnt;
所以......我得到了这个:
Detalle德尔Registro DATOS德尔ProcesoInformaciónRadicación德尔Proceso Despacho波南特003 JUZGADO市政 - 民用JUEZ TERCERO土木工程市政Clasificación德尔Proceso TIPO CLASE RECURSOUbicación德尔Expediente德EjecuciónEjecutivo的奇异SIN TIPO DE RECURSO档案馆Contenido德RadicaciónDemandante(多个)Demandado (s)Â3354216 - HORACIO DE JESUS JIMENEZ ARANGO 70128088 - RAFAEL ANGEL HERNANDEZ OROZCO Contenido Actuaciones del Proceso FechadeActuaciónActuaciónAnotaciónFechaIniciaTé©rmino Fecha FinalizaTérmino Fecha de Registro 2011年11月18日ARCHIVO DEFINITIVO CAJA 267 18 Nov 2011 2010年9月27日RECEPCIÓN MEMORIAL OJ F2 2010年9月21日2010年9月21日RECEPCIÔN MEMORIAL OJ F1 2010年9月21日2010年5月10日RETIRO DEMANDA - ART.88 PEDRO NEL OSPINA 2010年5月10日2010年5月03日FIJACIONESTADOACTUACIÓN REGISTRADA EL 03 / 05/2010 A LAS 11:32:40 2010年5月5日2010年5月5日2010年5月3日2010年5月3日汽车RECHAZA DEMANDA T.4 2010年5月7日2010年4月7日RADICACAÓN DEPROCESOACTORACIÔNDERADICACIÓN DE PROCESO REALIZADA EL 07/04/2010 A LAS 17:54 :2010年4月7日2010年4月7日2010年4月7日
只是一个纯文本。
所以,我的问题是:有没有办法保留Html结构,我的意思是“upPanelActuciones”中的Td和Tr或我想要的任何其他标签或属性?
提前感谢您的帮助!
答案 0 :(得分:2)
那是因为nodeValue
属性只能获取该节点的文本内容。
请改用saveXml()
方法:
$elm = $dochtml->getElementById('upPanelActuciones');
print $dochtml->saveXml($elm);