如何使用本体

时间:2012-03-30 14:44:49

标签: semantics semantic-web ontology

我有这个问题。我可以理解,网页只能由人而不是机器来解释。因此,我们创建词汇表和语义,并以有向图形格式表示rdf中的信息,以便机器甚至可以解释它。我们有主语谓词和宾语,其中主语,谓语和宾语可以是uris。但我很困惑,我们应该有一个rdf对应一个网站的每个页面,以便人类可以看到网页但机器的解释,他们可以使用rdf版本。我是对的吗?

我也看到使用本体工程,我们使用关联规则分析生成规则。我也有一些困惑。让我们说我想为一个领域创建一个本体论让我们说医疗。然后我使用关联规则挖掘我挖掘网站或其他数据来获得一些关联。但这样做我只能定义概念之间的关系。如何使用此挖掘获得新概念?

另外,我们如何使用这个新创建的本体。我们应该将它们添加到网站上吗?我不清楚。需要一些建议吗?

1 个答案:

答案 0 :(得分:7)

  

但我很困惑,我们应该有一个对应于网站每个页面的rdf,以便人类可以看到网页而不是机器的解释,他们可以使用rdf版本。我是对的吗?

RDF是一种数据模型,与关系模型一样,可用于存储各种信息。它不需要附加到网页。实际上,它甚至可以独立于Web存在。网页可以将RDF数据直接嵌入到HTML代码中(使用RDFa),因此您不一定需要对人和机器进行不同的表示。 HTML页面可以完全与RDF数据分开,但可以通过不同的方式将计算机定向到正确的位置,例如,通过网页标题中的链接,或使用semantic sitemap

在关联数据圈中,必须使用HTTP URI来描述事物以识别它们。当您查找URI时,您应该获得对该事物的描述,在这种情况下,为需要它的软件应用程序提供RDF以及向与人交互的用户代理提供HTML(例如Web浏览器)被认为是一种好的做法。 。例如,如果您使用Web浏览器转到http://dbpedia.org/resource/Lyon,则会获得this。如果您使用网络抓取工具转到相同的URI,则可能会改为that

  

如何使用此挖掘获取新概念?

本体工程和规则挖掘是不同的东西。通常,本体是在没有规则挖掘的情况下设计的。概念通常是由希望为某种目的设计本体的人之间达成协议而产生的。但是,可以从挖掘过程中猜出新概念,可能是文本挖掘或关联规则挖掘。但这与如何使用本体无关。

  

另外,我们如何使用这个新创建的本体。

大多数情况下,只使用本体的术语就可以使用本体。例如,假设你想描述吉姆,一个全名为詹姆斯·D·古奥的人。在RDF中,您知道使用URI识别内容,因此您需要一个Jim的URI,比如http://yourdomain.com/jim,缩写yd:jim以获得简洁(您必须为此决定自己的URI方案)。现在你想说吉姆是一个人。为此,您拥有特殊的预定义谓词rdf:type

 yd:jim  rdf:type  <aClassThatRepresentsPeople> .

现在,您可以为<aClassThatRepresentsPeople>创建自己的新URI,但这就是本体发挥作用的地方。这类人将被一遍又一遍地重复使用,所以你希望它成为许多人共有的术语。要使用本体术语,您只需编写其URI即可。你不需要任何特殊的东西来解释这个术语来自何处,也不需要进口陈述。由于URI应该是通用的,很明显,您使用的术语与本体中定义的术语完全相同。此外,如果本体遵循关联数据最佳实践,则类的URI应该是可解除引用的,这样当您使用HTTP GET查找URI时,您将获得该术语的定义。吉姆的名字也一样。你想在RDF中说出这样的话:

yd:jim  <theNameAttribute>  "James D. Goo" .

在这里,您不需要名称本身的URI,它只是一个字符串(虽然可以给它一个标识符,以便您可以将其分解为名字,中间名,姓,等等)。同样,对于<theNameAttribute>,您只需重用本体中定义的属性。所以最后,你可能会看到这样的东西:

yd:jim  rdf:type  foaf:Person .
yd:jim  foaf:name  "James D. Goo" .

其中foaf:是FOAF Ontology的前缀,这是一个用于在线描述人的流行词。

  

我们应该将它们添加到网站上吗?

不是真的,但在某种程度上是的。您可以重复使用在完全不同的网站上找到的现有本体(如FOAF)。这就是Web和关联数据的美妙之处:它是分布式和模块化的。但是如果你使用自己的本体(比如http://yourdomain.com/ontology),你应该通过解除引用来访问这个本体,也就是说,如果你查找本体的术语(例如,http://yourdomain.com/ontology#person),你的服务器应该回应本体或至少所请求术语的描述。您只需按照向网站添加任何文件的方式添加本体。