使用流解析器迭代Freebase rdf数据转储中的实体

时间:2013-09-24 01:30:46

标签: rdf freebase large-data

如何使用流式解析器迭代Freebase RDF数据转储并在PHP中打印每个实体的标题及其类型(类型/对象/类型)?

例如,使用expat:http://se2.php.net/manual/en/book.xml.php

或新的XML阅读器功能:http://se2.php.net/manual/en/book.xmlreader.php

或其他任何可解析Freebase RDF数据转储的流式解析器。

1 个答案:

答案 0 :(得分:2)

您真的不需要流式XML解析器。 Freebase RDF数据转储不是XML,它们是N-Triples,它们经过特殊格式化,因此您可以在选项卡上将它们分开。您需要做的就是打开文件,一次读取一行并在标签上分割每一行。