将HTML / XML中的网站转换为RDF

时间:2011-02-02 15:19:26

标签: rdf semantic-web

我想将任何html网站上的数据转换为rdf。 你知道任何html到rdf转换器吗? 或者,您是否为此建议使用XQuery或GRDDL?

2 个答案:

答案 0 :(得分:4)

一般情况下,自动转换是不可能的,因为HTML会说出看起来像什么,而不是它意味着什么。如果HTML包含现有标记,您可以使用Anything2Triples(http://developers.any23.org/)来获取RDF。

如果它只是HTML,你必须以某种方式编写自己的提取规则。 GRDDL可以工作,但我可能只是使用python + BeautifulSoup。这取决于你已经知道的技术/语言!

答案 1 :(得分:0)

如果HTML包含嵌入式RDFa,您可以使用RDFa解析器来提取信息。有适用于各种平台和语言的解析器,因此取决于您的开发环境。