当我尝试在函数中执行str_replace()
或preg_replace()
时,内容不会更改。
变量$sadrzaj
中的内容:
$sadrzaj = '<p>asdasdasds</p><p><a href="http://www.example.com/wp-content/uploads/2018/11/image.jpg" itemprop="url" title="some title"><img alt="some alt title" class="alignnone size-full wp-image-243618" src="http://www.example.com/wp-content/uploads/2018/11/image.jpg" width="940" height="529"></a></p>asdasdasd<p>asdasd</p><h3>asdada</h3><p><a href="http://www.example.com/wp-content/uploads/2018/11/image_02.jpg" itemprop="url" title="some title 02"><img alt="some alt title 02" class="alignnone size-full wp-image-243653" src="http://www.example.com/wp-content/uploads/2018/11/image_02.jpg" width="940" height="529"></a></p><h3>asdasd</h3>';
我的功能to_je_to()
:
function to_je_to($content){
preg_match_all('/<img (.*?)\/>/', $content, $images);
//print_r($images);
if(!is_null($images)){
foreach($images[1] as $index => $value){
if(strpos($images[1], 'size-full') !== false){
//if(preg_match('/alt=""/', $value)){
$new_img = preg_replace('<img', "<img data-example", $images[0][$index]);
$content = preg_replace($images[0][$index], $new_img, $content);
}
}
}
echo $content; // return no difference
}
调用函数to_je_to($sadrzaj);
-不变。
如果课程的类别为"size-full"
,请找到这些图片并将其标签替换为<img data-example ...>
。
即使str_replace()
或preg_replace()
无法正常工作。
我在做什么错了?
谢谢
答案 0 :(得分:3)
您在做的错误是使用正则表达式解析HTML。您应该使用适当的DOM解析器,然后可以使用XPath查询来隔离所需的元素。
<?php
$sadrzaj = '<p>asdasdasds</p><p><a href="http://www.example.com/wp-content/uploads/2018/11/image.jpg" itemprop="url" title="some title"><img alt="some alt title" class="alignnone size-full wp-image-243618" src="http://www.example.com/wp-content/uploads/2018/11/image.jpg" width="940" height="529"></a></p>asdasdasd<p>asdasd</p><h3>asdada</h3><p><a href="http://www.example.com/wp-content/uploads/2018/11/image_02.jpg" itemprop="url" title="some title 02"><img alt="some alt title 02" class="alignnone size-full wp-image-243653" src="http://www.example.com/wp-content/uploads/2018/11/image_02.jpg" width="940" height="529"></a></p><h3>asdasd</h3>';
function to_je_to($content) {
$dom = new DomDocument;
$dom->loadHTML($content, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
$xp = new DomXpath($dom);
$nodes = $xp->query("//img[contains(concat(' ', normalize-space(@class), ' '), ' size-full ')]");
foreach ($nodes as $img) {
$img->setAttribute("data-example", "");
}
return $dom->saveHTML();
}
echo to_je_to($sadrzaj);
然后,对您的原始代码进行评论:$images
将永远不会是null
,它将始终是一个数组。为什么要遍历$images[1]
然后替换基于$images[0]
的值?完全没有使用组匹配(.*?)
,因此它不需要在那里。循环中的preg_replace()
调用都没有在表达式周围使用定界符进行搜索,因此两者都将因错误而失败。 echo
和return
之间有很大的区别。
答案 1 :(得分:2)
您的函数存在一些问题(在您的preg_match_all
和preg_replace
中)。另外,在匹配class
标签上的<img>
方面,您还需要更加复杂。总体而言,如其他答案所建议的那样,最好使用内置的DOMDocument类。如果您想继续使用正则表达式,此功能应该可以解决您遇到的问题。
function to_je_to($content){
preg_match_all('/<img[^>]+>/', $content, $images);
if(!is_null($images)){
foreach($images[0] as $index => $value){
if(preg_match('/class="[^"]*(?<=["\s])size-full[\s"]/', $value)){
$new_img = str_replace('<img', '<img data-example', $value);
$content = preg_replace('/' . preg_quote($value, '/') . '/', $new_img, $content);
}
}
}
return $content; // return no difference
}
echo to_je_to($sadrzaj);