我正在研究扩展名为.ttl或.tql的DBpedia数据集。我想在不使用RDFlib的情况下将文件内容解析为dict或列表。这可能吗? 以下是文件的部分摘录。
<http://dbpedia.org/resource/AmoeboidTaxa> <http://www.w3.org/2000/01/rdf-schema#label> "AmoeboidTaxa"@en .
<http://dbpedia.org/resource/AlbaniaHistory> <http://www.w3.org/2000/01/rdf-schema#label> "AlbaniaHistory"@en .
<http://dbpedia.org/resource/AsWeMayThink> <http://www.w3.org/2000/01/rdf-schema#label> "AsWeMayThink"@en .
答案 0 :(得分:5)
使用rdflib找到解决方案:
Router
<强>更新强>
我意识到rdflib不会通过流式处理。因此,事实证明,处理非常庞大的文件(如dbpedia的文件)非常复杂。所以,我所做的是迭代dbpedia文件并将它们切成非常小的文件,然后如上所述使用rdflib进行处理。