解析在任意文本字符串中找到的第一个src
标记的<img>
属性,但不使用任何外部库的最简单但可靠的方法是什么?这意味着获取"
代码<img>
atrribute的开始和结束src
字符之间的所有内容。
我做了这个脚本,但在某些情况下它不是一个可靠的解决方案:
$string = $item['description'];
$arr = explode('img', $string);
$arr = explode('src', $arr[1]);
$arr = explode('=', $arr[1]);
$arr = explode('>', $arr[1]);
$pos1 = strpos($arr[0], '"')+1;
$pos2 = strrpos($arr[0], '"')-1;
if (!$pos1) {
$pos1 = strpos($arr[0], "'")+1;
$pos2 = strrpos($arr[0], "'")-1;
}
if ($pos1 && $pos2) {
$result = substr($arr[0], $pos1, $pos2);
}
else { $result = null; }
答案 0 :(得分:2)
如果您想获取img标签的所有属性的值,您需要制作2个正则表达式。
1.获取img标签的内容:
/<\s*img([^<>]+)>/
然后在功能preg_match_all()
的捕获内容上使用此正则表达式/\S+\s*=\s*[\'\"]([^\"\']+)[\'\"]/g
答案 1 :(得分:2)
这是你的答案: 首先,你需要调用这个正则表达式,
<img(.*?)>
然后,为了获得其他属性,您需要对前一个结果进行另一个正则表达式调用
"(.*?)"
答案 2 :(得分:1)
试试这个,
<img\s+src\s?\=\s?\"(https?\:\/\/[\w\.\/]+)\".*\/>
答案 3 :(得分:0)
唯一最安全的方法是使用DOMDocument
内置(在PHP 5中)类。使用getElementsByTagName()
,检查长度是否超过0,并使用src
获取第一项getAttribute('src')
值:
$html = "YOUR_HTML_STRING";
$dom = new DOMDocument('1.0', 'UTF-8');
$dom->loadHTML($html, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);
$imgs = $dom->getElementsByTagName('img');
if ($imgs->length > 0) {
echo $imgs->item(0)->getAttribute('src');
}