是否有任何针对Ontology / semantics / OWL / RDF的杀手级应用程序?

时间:2010-03-30 07:34:43

标签: rdf semantic-web sparql semantics owl

我在网上阅读了很多书籍,博客和文章之后对语义技术产生了兴趣,说它可以让数据机器理解,允许智能代理做出很好的推理,自动化和放大。动态服务组合等。

我还在阅读2年来的相同内容。文章/博客/语义会议的数量大幅增加。但我仍然无法看到任何杀手级应用程序。为什么会这样?或者是否已经存在一些应用程序/产品(商业/开源),实际上是在做所有被吹嘘的事情?

更准确地说,是否有任何产品利用语义技术(特别是RDF / OWL / SPARQL)并提供功能/性能/可维护性,这是现有(无语义)技术无法实现的?有些产品完全依赖于语义技术,真正为客户增加价值并创造收入吗?

7 个答案:

答案 0 :(得分:15)

我认为Drupal 7有可能成为一个杀手级的语义应用程序,它是具有相当大的安装基础的CMS的下一个版本,当发布是最终的并且每个人都开始升级时,大量的网站会自动暴露RDF采用嵌入式RDFa的形式,无需用户干预。

从商业角度来看,我认为linked data之类的内容GoodRelations是潜在的杀手级应用,例如,请参阅这些讨论BestBuy经验的Scott BrinkerPriyank Mohan篇博文将#{3}} GoodRelations基于linked data作为RDFa嵌入其网页后,流量增加了30%。

一般情况下,linked data是使用机器可读数据扩充网站的绝佳方式,并且在您网站的可见性方面取得了显着成效,我最近看到了来自BBC的人员{{{{{ 3}}应用程序(使用BBC自然历史资源的链接数据应用程序)已经优于Google搜索结果中某些维基百科的动物页面

答案 1 :(得分:7)

在生物学方面,对RDF&相关技术非常高。人们希望通过较少的解析和自定义代码来集成数据和更高级的查询。 RDF已经提供了前者;例如,UniProtKB,最大的生物医学资源之一,正在RDF中提供他们的数据。对于高级查询,我们还没有完成,因为良好的RDF数据和OWL本体的性能和可用性仍然有点缺乏。但它已经开始了,请查看BioGateway以获取可以执行的操作的示例。

从这个角度来看,这些技术的成果并非个人杀手级应用程序,而是为研究数据而不是编写临时脚本和设置临时SQL数据库以及所有这些管道的研究人员节省的所有时间。

答案 2 :(得分:7)

刚刚发现DBpedia。将维基百科的大量数据表示为RDF是一种很有希望的尝试。您可以将整个提取下载为16GB文件,但它也有keyword search page。表示为RDF允许非常特定的“语义”查询。 This显示了一些示例查询,例如您如何找到员工人数超过50000的公司的官方网站列表。您甚至可以使用任何可以与其公共API接口的包装器远程查询“云”,例如this Python module

答案 3 :(得分:6)

语义网依赖于内容提供商努力正确地注释所有内容以使其具有机器可读性。

对于大多数不是图书管理员的人来说,这是太多的工作。

真正的杀手级应用程序似乎可以从没有特殊标记的非结构化内容中获取语义。看看谷歌的搜索引擎所做的惊人工作。

为了使系统正常工作,不得给用户带来沉重的负担。

中间地带是Stackoverflow上的标记系统。它们工作得很好,即使标签完全是特殊的,而且部分不一致。

答案 4 :(得分:3)

深度语义支持对于需要强大查询的许多地方都很有趣。一个例子是我最近在工作的project,其中用于查找调度工作负载的位置的服务是基于语义的。 RDF / SPARQL本身很有趣,因为它可以立即为您提供非常丰富的查询,但是当您在其中添加OWL本体时会变得更好,因为这意味着您可以回答更丰富的查询(即,提出更接近用户的问题) - 和他们的雇主 - 真的想要)同时允许服务提供商更清楚地表达他们提供的东西。这并不是说这意味着每个人都告诉每个人一切,根本不是。相反,我们有各方描述提供了哪些服务,而不是他们用于配置这些服务的配置。通过在整个信息系统中普遍使用语义技术,所有这些都得到了充分发挥。

目前我正在研究Taverna,它正在使用RDF来提供加速记录系统;特别是,用户(特别是科学家)可以比仅通过一个巨大的文本文件grep更容易地搜索记录的大量信息。毕竟,如果你不得不使用文本挖掘来找出文本挖掘工作流程中真正发生的事情,那将会有点荒谬......

答案 5 :(得分:3)

我对AceWiki印象深刻。这是几个wiki项目中的一个,它试图在语义上组织人们输入的信息。

它仍在进行中,并且有一些局限性。例如,它只允许人们输入符合英语词汇和语法子集的句子。

然而,我希望这些起飞。那里有大量的免费数据(例如维基百科),我们无法创建程序来推理它,因为内容太嘈杂。

答案 6 :(得分:0)

Protege有利于开发本体。