想要使用Java从网页中提取RDF

时间:2015-04-09 06:24:21

标签: java rdfa

我想在网页中提取嵌入式RDF(Web语义),然后使用Java形成RDF数据的对应XML。任何类型的指针/建议/帮助将不胜感激。

例如,如果网页中有RDF的{​​{1}}实现,我希望在其中形成一个带有Movie标记的XML及其当前属性值,如{{1}等等。

目前,我可以使用Apache Jena API从数据库中提取数据并从Resultset中构建XML。但我仍然坚持如何从网页中提取相同的内容

1 个答案:

答案 0 :(得分:0)

如果您想将软件用作服务,那么Any23可以获取一些HTML并转换为RDF。如果您想从此创建SPARQL结果集,则加载到Jena模型中,然后运行查询。

或者,如果您不想使用SaaS从HTML / RDFa中提取RDF,请查看Shellac。它适用于Jena并包含一个CLI。