以下是我从页面中删除图片的正则表达式。
preg_match_all('/\bhttps?:\/\/\S+(?:png|jpg)\b/', $html, $matches
但是当图片网址如下时,它会失败:
src="//upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Adolescent_girl_sad_0001.jpg/200px-Adolescent_girl_sad_0001.jpg"
我认为需要在上面的正则表达式中添加OR
操作才能以//
开头的allove图像。
文档说|
管道将执行或操作。但是如何在上面的正则表达式中添加它?
答案 0 :(得分:1)
你可以避免小马的愤怒......
$dom = new DOMDocument();
$dom->loadHTML($html);
$images = $dom->getElementsByTagName('img');
$sources = array();
foreach($image as $img) $sources[] = $img->getAttribute("src");
完成!