我想知道是否有任何方法/工具将HTML文件转换为等效的RDF文件。
Thnx提前。非常感谢您的帮助。
答案 0 :(得分:4)
任意HTML都没有标准的等效RDF表示。如果您有高度常规的页面,您可以使用XSLT或只是简单的XML解析来从它们中抓取RDF。 iirc,这就是DBPedia项目最初获取数据的方式,通过抓取维基百科页面,这些页面往往是非常规则的格式,特别是每页上的那些边框。
但在一般情况下对此并不可能。您可能感兴趣的一件事是RDFa,这是关于如何在HTML中嵌入 RDF的w3c标准。
答案 1 :(得分:0)
答案 2 :(得分:0)
没有正式的方法可以做到这一点。 XHTML词汇表有一个名称空间:
http://www.w3.org/1999/xhtml/vocab#
XHTML的命名空间
这可能需要一些uris用于HTML元素,无论是属性还是类。你也可以使用都柏林核心的点点滴滴。