我知道在网络上你有很多页面相互链接,你可以从一页到另一页等等。
语义网是如何工作的?据我所知,它使用了关联数据的概念,其中数据通过URI或IRI进行识别和链接,而不是自己的网页。但是,当所有数据都存储在本地三维商店并且在三重商店内部链接时,我不明白数据是如何在网络上链接的。浏览器是否能够在幕后从triplestore转到triplestore并获取各种数据?或者数据如何实际链接?是否有一种机制可以在整个网络上从数据传输到数据,并在现实生活中使用数据的含义,或者使用类似这样的工具?
此外,任何人都可以创建本体,并以各种不同的方式定义和描述任何内容。这不会导致大量数据混乱吗?
所以,主要问题:
语义网和喜欢的数据如何实际运作?
答案 0 :(得分:2)
这是一个棘手且多方面的问题。
但是,当所有数据都存储在本地三维商店并且在三重商店内部链接时,我不明白数据是如何在网络上链接的
首先,重要的是要意识到三重商店不是必需品。您可以在顶部使用SQL服务器和D2RQ / R2RML映射来动态转换查询。或普通的RDF文件。或MongoDB等中的简单JSON文档,您可以通过adding a JSON-LD @context
进行扩展。
重要的是,您使用其中一种RDF格式(如turtle或JSON-LD)提供数据
浏览器是否能够在幕后从triplestore转到triplestore并获取各种数据?
请注意,他们不必这样做,因为正如您所提到的,使用URI以便浏览器(不一定是Web浏览器)可以下载数据。当然,这些URI是URL,dereferenceable。否则它们只是标识符。
或者数据是如何实际链接的?
只需重复使用对象和属性的标识符即可将其链接起来。这就是使用URI(IRI)的原因,因此标识符是全局唯一的并且在域内私密创建。当然,创建URI是其他人的域名,因此存在恶作剧的风险。不过,这是一个单独的主题。
是否有一种机制可以在整个网络上从数据传输到数据并在现实生活中使用数据的含义,或者使用类似这样的工具?
一种简单的机制是简单地抓取RDF数据并下载到本地存储。匹配标识符的简单出现将数据组合成更大的数据集,并且需要更少的映射工作。这当然是理论,因为您冒险数据的风险可能是腐败,不正确或重复,因此您需要一些策展。技术的存在是为了帮助您实现这一目标,而您不会遇到的是传统的数据仓库。搜索引擎从HTML页面(RFDa / Microdata)收集语义标记的方式与此类似。
另一种选择是使用federated queries。 SPARQL能够自动下载RDF数据并在内存中对其执行查询。
最后但并非最不重要的是,使用Triple Pattern Fragments
进行了联合查询正如我所写,问题并非那么简单。您主要询问 关联数据 。语义网不仅仅是:
我希望我在某种程度上回答了你的问题。