将HTML文件转换为RDF文件

时间:2012-06-14 20:37:16

标签: html rdf

我想知道是否有任何方法/工具将HTML文件转换为等效的RDF文件。

Thnx提前。非常感谢您的帮助。

3 个答案:

答案 0 :(得分:4)

任意HTML都没有标准的等效RDF表示。如果您有高度常规的页面,您可以使用XSLT或只是简单的XML解析来从它们中抓取RDF。 iirc,这就是DBPedia项目最初获取数据的方式,通过抓取维基百科页面,这些页面往往是非常规则的格式,特别是每页上的那些边框。

但在一般情况下对此并不可能。您可能感兴趣的一件事是RDFa,这是关于如何在HTML中嵌入 RDF的w3c标准。

答案 1 :(得分:0)

不幸的是,不,不是真的。阅读thisthis可能会帮助您理解原因。

答案 2 :(得分:0)

没有正式的方法可以做到这一点。 XHTML词汇表有一个名称空间:

http://www.w3.org/1999/xhtml/vocab#

XHTML的命名空间

http://www.w3.org/1999/xhtml

这可能需要一些uris用于HTML元素,无论是属性还是类。你也可以使用都柏林核心的点点滴滴。