我需要的数据类似于GKG主要用于命名实体识别。基本上我想使用实体背后的上下文(额外信息)进行实体识别。建议使用数据的方式是什么?
我发现DBPedia提供了所需,但我觉得数据不完整。对于像#34; Larry_Page"这样的实体,在3.8版本的instance_types转储中,内容似乎是
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.w3.org/2002/07/owl#Thing> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> .
<http://dbpedia.org/resource/Larry_Page> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Agent> .
所以,对于&#34; Larry_Page&#34;信息限制直到&#34; Person&#34;类型。 有什么方法可以获得具有类型的实体的完整层次结构吗?
答案 0 :(得分:0)
你试过Freebase吗?在Freebase中,他们为Larry Page提供了一个/ common / topic / notable_for计算机科学家。这些数据库的问题在于你必须做很多工程(魔术)才能选择正确的谓词。而你总是有一些噪音。
P.S。很抱歉发布回复,我没有足够的声誉来添加评论:)