打开链接的data_a数据集

时间:2012-01-30 14:22:02

标签: dataset notepad++ rdf linked-data

我下载了一个应该是RDF格式http://iw.rpi.edu/wiki/Dataset_1329的数据集,使用Notepad ++我打开它但无法读取它。有什么建议?

2 个答案:

答案 0 :(得分:2)

未压缩的文件大约为140MB。由于文件的大小,Notepad ++可能会失败。此数据集中使用的RDF格式为Ntriples,每行一个三元组,包含三个组件(主题,谓词,对象),非常易读。来自文件的示例数据:

<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_other_multi_racial> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_black_and_white> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/national_origin_hispanic> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/filed_cases> "1" .

如果您想查看数据,请尝试使用流式传输文件的工具打开它,而不是一次性加载所有数据,例如lesshead

如果您想使用这些数据,可能需要考虑将其加载到三重存储(4store,Virtuoso,Jena TDB,...)中,并使用SPARQL进行查询。

答案 1 :(得分:-1)

尝试使用Google Refine(可能使用RDF扩展名:http://lab.linkeddata.deri.ie/2010/grefine-rdf-extension/