关于“微格式与HTML + RDFa”采用的统计数据

时间:2015-02-19 14:53:42

标签: usage-statistics microformats rdfa

是否有一些最近和可靠的统计信息"网络使用" (这些标准使用一种标准或另一种标准的网页)?

或关于vCard(个人和/或组织)使用范围的具体统计数据?

只有统计数据,这个问题不是关于"什么是最好的意识形态?"或"如何使用它?"。查找要将Microformats adoption(any kind of) RDFa in HTML adoption进行比较的统计数字。

我们可以考虑,计算页面"统计信息,Microdata是一种RDFa-HTML。


注意

解释上下文

RDFa Lite是唯一W3C recommendation,当我们谈论" Microdata vs Microformat"和Microdata有更好的地图 RDFa Lite 。 HTML5已于2014年10月28日成为W3C推荐标准,并且没有一个受到W3C的祝福。我理解schema.org是采用(重用社区模式)RDFa的最佳方式。

另一方面Microformats更老,也更简单;也许,最常用于网络(!?是吗?)。

关于" vCard数据统计"

如果我们需要一些范围来统计,请让我们使用vCard作为范围:

  • Microformat的hCardh-Card是(任意)HTML上显示vCard的标准,用于人员和组织。

  • schema.org ' PersonOrganization使用(标准) RDFa Lite 或Microdata对vCard信息进行编码

其他说明

维基百科表达了一个旧的(2012年)和不可确认的断言(没有来源!),"微信息如hCard,然而,继续发布的不仅仅是模式和其他的web" Webdatacommons是一团糟,没有统计报告。

(编辑)现在维基百科的引用错误已修复。


(@sashoalm评论后编辑) 注意那些不同意这个问题是有效的人。

此问题是软件问题,而不是对场外资源的请求" ...

问题:要确定项目中的库,框架,数据模型等,我们需要使用今天和未来几年正在使用的工具...... project decisions在软件开发中,我们需要有关用户趋势,框架采用等的统计信息。

PS:在Stackoverflow中有很多关于语言统计的讨论,那就是相同的"一系列问题"。示例:123456。另请参阅questions tagged with [usage-statistics]

2 个答案:

答案 0 :(得分:4)

现在我看,有一些统计数据(!!),维基百科的链接丢失了...我纠正了。它没有更新,是来自“2013年冬季”(~1.5或2年收集的数据),但显示现实和趋势。

http://webdatacommons.org/structureddata/index.html#toc2

这是报告中的图表(RDFa+HTML支配地位!):

enter image description here

enter image description here

口译

  • 第5节“提取过程”,在每个页面上说“,我们根据Anything To Triples(Any23)库运行我们的RDF提取器”,所以(RDF)和Microformat)导致“三元组”(不仅是RDF)。

  • “每个域名”统计数据的意思是域名对所有页面使用统一政治......但我认为这种统一性是错误的,每个域只有少数页面采用“语义标记”......它不是比URL更公正,只是另一张图片。无论如何,结果是死热,约57%对43%。

  • 2013年只有21%的“语义标记网址”是Microformat ,所有其他网址都是RDFa-HTML(微数据也是一种RDFa)。

  • 使用域(Ds)和URL(Us),(Ds + Us)/ 2的平均百分比,RDF的结果为~60%,微格式的结果为~40%。

    < / LI>
  • 2013年之前,微格式占据主导地位,因此,自2011年以来“RDFa-HTML”的大幅增长显而易见......这种趋势很明显。

  • 如果我们采用“每个域”和“每个URL”计数的算术平均值,我们将Microformats和RDFa-HTML相互靠近,但是Microformat却少之又少(而且RDFa-HTML很强烈)在2014年成长。)

这是@sashoalm讨论的表格,显示百分比和总数

enter image description here


注1:HTML5仅在2014-10-28发布,因此只有~2015-10我们才能检查新标准对网络的真实(明确)影响。一个重要的预期影响是Microdata没有得到HTML5的祝福,所以唯一的标准是 HTML + RDFa (推荐 RDFa Lite )......将来也许会有更少的Microdata和更多schema.org

注2:计算网页数量的方法问题,boilerplate text带有一些巨大克隆的“语义标记”:我认为“下一代”的statiscs 可以使用一些“每个域analisys“进行多样性的(语义标记页面)的URL子状态(采样)。理想的是权衡(例如,一旦非克隆并使用克隆的1+SQRT(count)计数,例如,计数器。)

结论

今天也许有些人使用 Microformat ,但是使用 RDFa-HTML (Microdata,RDFa,RDFa Lite等)在Web上有更多页面,趋势是成长。

如果您的项目是针对未来几年的,那么统计数据会说使用RDFa。


对RDFa的另一个有趣的计算不是使用,而是重复使用词汇(!)。见Linked Open Vocabularies (LOV)

LOV

答案 1 :(得分:2)

WebDataCommons的最新统计数据如下:

来源:http://webdatacommons.org/structureddata/2016-10/stats/stats.html

解析的域数:3400万个付费级域名 拥有RDFa,微数据和微格式的域名数量:563万(16.5%)

不同格式的受欢迎程度: enter image description here