如何从维基百科中检索共享的元数据?

时间:2014-05-12 13:29:04

标签: facebook share opengraph wikipedia

有一个Open Graph Meta Tag可以通过SNS分享。我知道Open Graph通常用于共享。但是,我找不到维基百科文章中的Open Graph Meta Tag。但是,我试图分享来自Google Plus和Facebook的维基百科文章,它就像使用Open Graph Meta Tags一样非常好。

您能告诉我如何从维基百科文章中检索元数据吗?维基百科有一种特殊的方法吗?

1 个答案:

答案 0 :(得分:1)

维基百科文章目前不包含任何Open Graph标签。因此,可以安全地假设嵌入在维基百科页面的Facebook共享中的信息(例如)是以老式的方式收集的,就像Facebook在发布Open Graph之前一直在努力改进流程的方式:通过将其解析出页面源。

虽然它不像Open Graph那样简化和结构化,但解析后的共享是可管理的,因为实际上没有那么多[meta]数据进入“遗留”Facebook共享。标题直接取自HTML< TITLE>实体,源/作者/发布者是站点主机名,然后进行最佳猜测以识别片段的正文文本,以及图像(或图像,因为它们有时会捕获多个候选者供共享者选择)到用作分享缩略图。

通常运行良好,正如您所观察到的那样 - 生成的HTML是可预测的 - 但并非总是如此,尤其是(在维基百科的情况下)图像所涉及的位置。例如,这就是Wikipedia "Uranus" article在Facebook共享中的显示方式:

enter image description here

在文章的信息框中有一张行星的照片,但这是一个深埋(从HTML源角度来看),Facebook的解析器经常错过的右对齐元素。由于维基百科的内容绝大多数以散文为中心,因此许多其他文章根本不包含图像。 Facebook的解析器经常使用文章正文中某处的左对齐插图(如此处所示),甚至是页面页脚中的一个维基媒体项目图标,作为维基百科上的“缩略图”。