我想将任何html网站上的数据转换为rdf。 你知道任何html到rdf转换器吗? 或者,您是否为此建议使用XQuery或GRDDL?
答案 0 :(得分:4)
一般情况下,自动转换是不可能的,因为HTML会说出看起来像什么,而不是它意味着什么。如果HTML包含现有标记,您可以使用Anything2Triples(http://developers.any23.org/)来获取RDF。
如果它只是HTML,你必须以某种方式编写自己的提取规则。 GRDDL可以工作,但我可能只是使用python + BeautifulSoup。这取决于你已经知道的技术/语言!
答案 1 :(得分:0)
如果HTML包含嵌入式RDFa,您可以使用RDFa解析器来提取信息。有适用于各种平台和语言的解析器,因此取决于您的开发环境。