PHP - 没有循环访问命名空间数组键的任何方法吗?

时间:2017-10-20 09:27:16

标签: php associative-array key-value get-meta-tags

设置

这是专门针对Twitter Cards,但我正在寻找更通用的(即不是特定于Twitter卡的)解决方案,因为许多元标记都是命名空间。

Twitter卡存储在meta标签内的网页页眉中。有点像...

<meta name="twitter:site" content="... tag content ...">

当您在使用这些卡的网站上运行get_meta_tags()时,您将获得类似于......的回报。

[
    ... bunch of other meta tags ...

    "twitter:card" : "... tag content ...",
    "twitter:description" : "... tag content ...",
    "twitter:title" : "... tag content ...",
    "twitter:site" : "... tag content ...",
    "twitter:image" : "... tag content ...",
    "twitter:creator" : "... tag content ...",

    ... maybe some more tags ...
]

与Twitter卡有关的所有密钥都是命名空间 - 我的意思是每个密钥都以twitter:开头。

即使页面上有Twitter卡片标签,也不一定上面列出的所有标签都必须存在。有时候它们都是它们,有时它只是一对。

问题

让我们给我们一些元标记...

$tagsList = @get_meta_tags($url);

因为您不知道肯定会哪些标签会出现,所以测试它们都没有意义......

if(isset($tagsList['twitter:card'])) {
    // Do something
}

if(isset($tagsList['twitter:description'])) {
    // Do something
}

... and so on ...

如果您不知道可能存在的每个可能的标记名称,或者Twitter决定更改当前标准,则此方法也特别无效。

相反,你循环遍历每个标签......

$twitterList = array();

foreach($tagsList as $tagName => $tagCont) {

    if(strpos(strtolower($tagName), 'twitter:') === 0) {

        // root = 'twitter', sub = 'card' or 'description' or ...
        list($root, $sub) = explode(':', $tagName);

        $twitterList[] = array(
            'root' => $root,   // Don't really need this
            'sub' => $sub, 
            'content' => $tagCont
        );

    }

}

这是一种享受。这是准确的,并将您的Twitter卡标签返回到一个很好的列表中。但是,如果我只需要与Twitter卡有关的标签,为什么我应该忙着自己循环遍历所有这些??

问题

是否可以快速访问这些命名空间的密钥,而无需遍历从页面返回的每个元标记?我只对twitter:感兴趣,所以我不想浪费资源和时间来遍历每个标签。

像...一样的东西。

$twitterTags = $tagsList['twitter:'];

其中输出将沿着......

$twitterTags : [
    'card' : 'card content', 
    'description' : 'desc content', 
    ... and so on ...
]

我认为您可能可以使用array_map()可能缩短所使用的代码行数,但您仍然会遍历每个密钥。

好的,我知道这不一定是必要的,但是......

除非页面具有不合理数量的元标记(其中包含多个标记),否则暴力循环和更优雅的解决方案之间的时间/资源差异可以忽略不计。但这仍然是一项有趣的练习。

编辑#1

感谢Daniel Klein,我发现了这个美丽......

function preg_grep_keys($pattern, $input, $flags = 0) {
    return array_intersect_key($input, array_flip(preg_grep($pattern, array_keys($input), $flags)));
}

以下列方式使用...

$pattern = '/(twitter\:)([\w\d\-\_]+)/';

$twitterList = preg_grep_keys($pattern, $tagsList, $flags = 0);

并返回......

"twitterList": {
    "twitter:card": "... tag content ...",
    "twitter:description": "... tag content ...",
    "twitter:title": "... tag content ...",
    "twitter:site": "... tag content ...",
    "twitter:image": "... tag content ...",
    "twitter:creator": "... tag content ..."
}

多么宝贵!但是,我不确定array_intersect_key()array_flip()如何处理他们的业务。我可能仍然在数组上循环。肯定array_keys()必须遍历数组?

无论如何,它看起来比上面的foreach()更漂亮。

1 个答案:

答案 0 :(得分:1)

没有这样的功能,因为get_meta_tags()不是为此而设计的(当然是在Twitter引入他们自己的元标记集之前设计的)。

你必须像你一样迭代列表(或者你自己也提到使用array_map())或者使用DomDocument加载html并遍历/搜索(使用xpath)DOM结构来查找元数据你正在寻找的标签。

事实上,twitter:description命名方案只是Twitter选择的命名方案。它不是一个实际的命名空间,也不是任何标准的标签。如果你想让php支持get_meta_tags的这个功能,你可以尝试propose it as a feature to add