目前我正在使用dbpedia本体ontology 识别类型层次结构mapping based properties以从实体中提取属性并识别它们之间的关系。为了识别实体的类型,我使用数据集infobox types / instance types使用java.net.URlDecoder来识别实体的名称我在构建的批处理链中得到了很多未找到的错误。在概念层面上有什么我做错的吗? (基本上它可以工作但是某些实体无法解析为未知类型的默认值)。我是否需要使用任何其他数据集来识别dbpedia类型?
为清晰起见而更新:我正在使用类似这样的类型实例:
<http://dbpedia.org/resource/Autism> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Disease> .
我正在提取自闭症和疾病,以确定自闭症是一种疾病。要将属性映射到我正在使用的自闭症:
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/diseasesdb> "1142"@en .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/icd9> "299.00"@en .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/omim> "209850"^^<http://www.w3.org/2001/XMLSchema#integer> .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/medlineplus> "001526"@en .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/emedicineSubject> "med"@en .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/emedicineTopic> "3202"@en .
<http://dbpedia.org/resource/Autism> <http://dbpedia.org/ontology/meshId> "D001321"@en .
<http://dbpedia.org/resource/Autism> <http://xmlns.com/foaf/0.1/name> "Autism"@en .
如果三元组中的最后一个语句不是属性,那么我正在创建这些元素之间的关系。我该怎么做才能识别URI?
<http://dbpedia.org/resource/Autism>
只是剥离标签并提取自闭症一词似乎没有达成协议?