有没有人知道如果php不是来自白名单数组或黑名单数组中的域,那么在php中采用一段文本并删除iframe?所以我可以允许像YouTube,Facebook这样的iframe,但不是每个网站。
答案 0 :(得分:5)
<h3>Allowed</h3>
<iframe src="http://youtube.com" ></iframe>
<iframe src="http://www.facebook.com" ></iframe>
<iframe src="http://google.com" ></iframe>
<h3>Banned</h3>
<iframe src="http://example.com" ></iframe>
<iframe src="http://alexanderdickson.com" ></iframe>
// Make a list of allows hosts.
$allowedHosts = array(
'youtube.com',
'facebook.com',
'google.com'
);
$dom = new DOMDocument;
$dom->loadHTML($str);
// Get all iframes in the document.
$iframes = $dom->getElementsByTagName('iframe');
$iframesLength = $iframes->length;
// Iterate over all iframes.
while ($iframesLength--) {
$iframe = $iframes->item($iframesLength);
if ($iframe->hasAttribute('src')) {
// Get the src attribute of the iframe.
$src = $iframe->getAttribute('src');
// Get the host of this iframe, to compare with our allowed hosts.
$host = parse_url($src, PHP_URL_HOST);
// If not host, then skip this iframe.
if ($host === NULL) {
continue;
}
// Strip www. because otherwise it may be 'www.facebook.com` and we have only
// banned `facebook.com`.
$host = preg_replace('/^www\./', '', $host);
// If this host is not in our allowed list, remove it from the document.
if ( ! in_array($host, $allowedHosts)) {
$iframe->parentNode->removeChild($iframe);
}
}
}
echo $dom->saveHTML();
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body>
<h3>Allowed</h3>
<iframe src="http://youtube.com"></iframe>
<iframe src="http://www.facebook.com"></iframe>
<iframe src="http://google.com"></iframe>
<h3>Banned</h3>
</body></html>
如果您不希望返回的HTML包含在所有html
,body
等中,请在最后运行此代码...
$html = '';
foreach($dom->getElementsByTagName('body')->item(0)->childNodes as $node) {
$html .= $dom->saveXML($node, LIBXML_NOEMPTYTAG);
}
如果你有&gt; = PHP 5.3.6,请将上面的saveXML()
替换为saveHTML()
。
是否可以修改
$iframe->parentNode->removeChild($iframe);
来替换iframe
?
是的,用...替换整个块
// Create video element
$video = $dom->createElement('video');
// Attach whatever you need to...
$video->setAttribute('src', 'whatever');
// Get a reference to the parent of the iframe
$parent = $iframe->parentNode;
// Insert the video element before the iframe
$parent->insertBefore($video, $iframe);
// Remove the iframe
$parent->removeChild($iframe);
答案 1 :(得分:0)
我使用了一个HTML DOM解析器,例如PhPQuery,只是遍历所有iframe标记,并删除任何具有不以youtube开头的src以及白名单中的其他网站。然后只打印生成的HTML。