我下载了一个应该是RDF格式http://iw.rpi.edu/wiki/Dataset_1329的数据集,使用Notepad ++我打开它但无法读取它。有什么建议?
答案 0 :(得分:2)
未压缩的文件大约为140MB。由于文件的大小,Notepad ++可能会失败。此数据集中使用的RDF格式为Ntriples,每行一个三元组,包含三个组件(主题,谓词,对象),非常易读。来自文件的示例数据:
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_other_multi_racial> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_black_and_white> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/national_origin_hispanic> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/filed_cases> "1" .
如果您想查看数据,请尝试使用流式传输文件的工具打开它,而不是一次性加载所有数据,例如less
或head
。
如果您想使用这些数据,可能需要考虑将其加载到三重存储(4store,Virtuoso,Jena TDB,...)中,并使用SPARQL进行查询。
答案 1 :(得分:-1)