标签: java rdfa
我想在网页中提取嵌入式RDF(Web语义),然后使用Java形成RDF数据的对应XML。任何类型的指针/建议/帮助将不胜感激。
RDF
例如,如果网页中有RDF的{{1}}实现,我希望在其中形成一个带有Movie标记的XML及其当前属性值,如{{1}等等。
目前,我可以使用Apache Jena API从数据库中提取数据并从Resultset中构建XML。但我仍然坚持如何从网页中提取相同的内容
答案 0 :(得分:0)
如果您想将软件用作服务,那么Any23可以获取一些HTML并转换为RDF。如果您想从此创建SPARQL结果集,则加载到Jena模型中,然后运行查询。
或者,如果您不想使用SaaS从HTML / RDFa中提取RDF,请查看Shellac。它适用于Jena并包含一个CLI。