Python库/代码,用于解析dbpedia中的.nt文件

时间:2012-07-24 10:03:57

标签: python rdf dbpedia

我想解析以.nt格式存在的dbpedia data(N-Tuples)。我已经下载了.nt文件,并且在我的本地磁盘中。

例如,我想找出所有实体及其主页。

我想做python。现在,我能做的唯一方法是做一个grep,或迭代所有行并选择我想要的那些。是否有任何好的图书馆可以让我这样做?

我看了RDFLib。但是所有的例子都告诉你如何编写或创建.nt格式而不是从它们中读取。

1 个答案:

答案 0 :(得分:4)

来自rdflib docs.

>>> from rdflib.graph import Graph
>>> g = Graph()
>>> g.parse("demo.nt", format="nt")

你刚才需要format= kwarg。