使用php从Joomla的文章中获取图像

时间:2012-10-17 17:25:56

标签: php joomla opengraph preg-match-all

我正在尝试编辑一个插件,我用它来向标题添加元开放图形标记。它的问题在于它只能让我为整个网站选择一张图片。这就是我所做的:

preg_match_all('/<img .*?(?=src)src=\"([^\"]+)\"/si', $hdog_base, $image);

if (strlen($hdog_base) <= 25) 
{
    if (substr($image[0], 0, 4) != 'http') 
    {
        $image[0] = JURI::base().$image[0]; 
    }
    $hdog_image_tmp = $image[0];
}
else
{
    if (substr($image[1], 0, 4) != 'http') 
    {
        $image[1] = JURI::base().$image[1]; 
    }
    $hdog_image_tmp = $image[1];
}
$hdog_image =   '<meta property="og:image" content="'.$hdog_image_tmp.'" />
';

$ hdog_base是我当前的网页。 第一个if语句将显示第一张图片,即徽标(用于前主页),而else会显示第二张图片(每页上会有所不同),但结果只会出现这样无论我是在主页上还是在网站的其他任何地方:

<meta property="og:image" content="http://mysite.com/Array" />

有什么建议吗?

提前致谢,

更新: 我正在犯的最大的错误是我试图在网址中找到图像,而不是实际的网页。但只是链接。那么我将如何继续以字符串形式获取当前页面的内容?而不是$ hdog_base,这只不过是一个链接。

更新,已解决:

我用过

$buffer = JResponse::getBody();

以HTML格式获取网页

然后是其余的DOM

$doc = new DOMDocument();
@$doc->loadHTML($buffer);

$images = $doc->getElementsByTagName('img');
if (strlen($hdog_base) <= 26) 
{
    $image = $images->item(0)->getAttribute('src');
} 
else 
{
    $image = $images->item(1)->getAttribute('src');
}
if (substr($image, 0, 4) != 'http') $image = JURI::base().$image;
$hdog_image =   '<meta property="og:image" content="'.$image.'" />
';

非常感谢 cpilko 的帮助! :)

1 个答案:

答案 0 :(得分:3)

在正则表达式中使用带有多个子模式的preg_match_all将返回一个多维数组。在您的代码$image[n]中是一个数组。如果你在php中将数组转换为字符串,那么返回文本Array

编辑:使用正则表达式解析HTML并不理想。你最好用DOMDocument

来做这件事
$doc = new DOMDocument();
@$doc->loadHTML($hdog_base);

$images = $doc->getElementsByTagName('img');
if (strlen($hdog_base) <= 25) {
    $image = $images->item(0)->getAttribute('src');
} else {
    $image = $images->item(1)->getAttribute('src');
}
if (substr($image[0], 0, 4) != 'http') $image .= JURI::base();
$hdog_image =   '<meta property="og:image" content="'.$hdog_image_tmp.'" />
';