php html标签转换为字符串

时间:2016-07-11 11:01:38

标签: php html dom html-entities

我正在尝试使用php作为DOM文档处理HTML文件。处理没问题,但是当我使用$ html-> saveHTMLFile(" file_out.html")保存html文档时;所有链接标记均来自:

Click here: <a title="editable" href="http://somewhere.net">somewhere.net</a>

Click here: &lt;a title="editable" href="http://somewhere.net"&gt; somewhere.net &lt;/a&gt; 

我将链接作为php脚本处理,也许这有所不同? 我无法将&lt;转换回&lt;使用htmlentitites_decode()等。我可以使用其他任何转换或编码吗?

php脚本如下所示:

<?php
$text = $_POST["textareaX"];
$id = $_GET["id"];
$ref = $_GET["ref"];
$html = new DOMDocument(); 
$html->preserveWhiteSpace = true;
$html->formatOutput       = false;
$html->substituteEntities = false;
$html->loadHTMLFile($ref.".html"); 
$elem = $html->getElementById($id); 
$elem->nodeValue = $innerHTML;

if ($text == "")
  { $text = "--- No details. ---"; }
$newtext = "";
$words = explode(" ",$text);
foreach ($words as $word) {
  if (strpos($word, "http://") !== false) {
    $newtext .= "<a alt=\"editable\" href=\"".$word."\">".$word."</a>"; 
    }
  else {$newtext .= $word." ";}
}

$text = $newtext;

function setInnerHTML($DOM, $element, $innerHTML) {
  $node = $DOM->createTextNode($innerHTML);
  $children = $element->childNodes;
  foreach ($children as $child) {
    $element->removeChild($child);
  }
  $element->appendChild($node);
}

setInnerHTML($html, $elem, $text);
$html->saveHTMLFile($ref.".html");
header('Location: '."tracking.php?ref=$ref&user=unLock");
?>

我们从&#34; id&#34;获得对文件的引用。和&#34; ref&#34;和来自数组&#34; textareaX&#34;的输入数据。接下来,我打开文件,通过id识别html元素,并用textarea中的输入数据替换其内容(链接)。我只提供textarea中的href,脚本从中构建超链接。接下来,我将其重新插入原始文件并覆盖输入文件。

当我写新文件时,链接<a href= ...> </a>会转换为&lt;a href=...&gt; &lt;/a&gt;,这是一个问题。

1 个答案:

答案 0 :(得分:1)

以下是您发现问题的代码的一部分:

<?php

function setInnerHTML($DOM, $element, $innerHTML) {
  /*********************************
      Well, there's your problem:
  **********************************/
  $node = $DOM->createTextNode($innerHTML);
  $children = $element->childNodes;
  foreach ($children as $child) {
    $element->removeChild($child);
  }
  $element->appendChild($node);
}

?>

您正在做的是将新的锚点(a)标记作为字符串传递,然后从中创建文本节点(文本就是 - 文本,而不是HTML)。 createTextNode函数会自动对任何HTML标记进行编码,以便在浏览器查看时它们可以显示为文本(如果您愿意,可以在页面上将HTML显示为可见代码)。

您需要做的是将元素创建为HTML(不是文本节点),然后附加它:

<?php

function setInnerHTML($DOM, $element, $innerHTML) {

  $f = $DOM->createDocumentFragment();
  $f->appendXML($innerHTML);
  $element->appendChild($f);

}

?>