设置
这是专门针对Twitter Cards,但我正在寻找更通用的(即不是特定于Twitter卡的)解决方案,因为许多元标记都是命名空间。
Twitter卡存储在meta
标签内的网页页眉中。有点像...
<meta name="twitter:site" content="... tag content ...">
当您在使用这些卡的网站上运行get_meta_tags()
时,您将获得类似于......的回报。
[
... bunch of other meta tags ...
"twitter:card" : "... tag content ...",
"twitter:description" : "... tag content ...",
"twitter:title" : "... tag content ...",
"twitter:site" : "... tag content ...",
"twitter:image" : "... tag content ...",
"twitter:creator" : "... tag content ...",
... maybe some more tags ...
]
与Twitter卡有关的所有密钥都是命名空间 - 我的意思是每个密钥都以twitter:
开头。
即使页面上有Twitter卡片标签,也不一定上面列出的所有标签都必须存在。有时候它们都是它们,有时它只是一对。
问题
让我们给我们一些元标记...
$tagsList = @get_meta_tags($url);
因为您不知道肯定会哪些标签会出现,所以测试它们都没有意义......
if(isset($tagsList['twitter:card'])) {
// Do something
}
if(isset($tagsList['twitter:description'])) {
// Do something
}
... and so on ...
如果您不知道可能存在的每个可能的标记名称,或者Twitter决定更改当前标准,则此方法也特别无效。
相反,你循环遍历每个标签......
$twitterList = array();
foreach($tagsList as $tagName => $tagCont) {
if(strpos(strtolower($tagName), 'twitter:') === 0) {
// root = 'twitter', sub = 'card' or 'description' or ...
list($root, $sub) = explode(':', $tagName);
$twitterList[] = array(
'root' => $root, // Don't really need this
'sub' => $sub,
'content' => $tagCont
);
}
}
这是一种享受。这是准确的,并将您的Twitter卡标签返回到一个很好的列表中。但是,如果我只需要与Twitter卡有关的标签,为什么我应该忙着自己循环遍历所有这些??
问题
是否可以快速访问这些命名空间的密钥,而无需遍历从页面返回的每个元标记?我只对twitter:
感兴趣,所以我不想浪费资源和时间来遍历每个标签。
像...一样的东西。
$twitterTags = $tagsList['twitter:'];
其中输出将沿着......
$twitterTags : [
'card' : 'card content',
'description' : 'desc content',
... and so on ...
]
我认为您可能可以使用array_map()
,可能缩短所使用的代码行数,但您仍然会遍历每个密钥。
好的,我知道这不一定是必要的,但是......
除非页面具有不合理数量的元标记(其中包含多个标记),否则暴力循环和更优雅的解决方案之间的时间/资源差异可以忽略不计。但这仍然是一项有趣的练习。
编辑#1
感谢Daniel Klein,我发现了这个美丽......
function preg_grep_keys($pattern, $input, $flags = 0) {
return array_intersect_key($input, array_flip(preg_grep($pattern, array_keys($input), $flags)));
}
以下列方式使用...
$pattern = '/(twitter\:)([\w\d\-\_]+)/';
$twitterList = preg_grep_keys($pattern, $tagsList, $flags = 0);
并返回......
"twitterList": {
"twitter:card": "... tag content ...",
"twitter:description": "... tag content ...",
"twitter:title": "... tag content ...",
"twitter:site": "... tag content ...",
"twitter:image": "... tag content ...",
"twitter:creator": "... tag content ..."
}
多么宝贵!但是,我不确定array_intersect_key()
和array_flip()
如何处理他们的业务。我可能仍然在数组上循环。肯定array_keys()
必须遍历数组?
无论如何,它看起来比上面的foreach()
更漂亮。
答案 0 :(得分:1)
没有这样的功能,因为get_meta_tags()不是为此而设计的(当然是在Twitter引入他们自己的元标记集之前设计的)。
你必须像你一样迭代列表(或者你自己也提到使用array_map())或者使用DomDocument加载html并遍历/搜索(使用xpath)DOM结构来查找元数据你正在寻找的标签。
事实上,twitter:description
命名方案只是Twitter选择的命名方案。它不是一个实际的命名空间,也不是任何标准的标签。如果你想让php支持get_meta_tags的这个功能,你可以尝试propose it as a feature to add