RDF读取/解析错误

时间:2011-11-14 11:03:35

标签: rdf jena allegrograph

我有一些RDF文件要导入到一个tripplestore(AllegroGraph),但是在第一个文件中我得到一个SAX解析器错误,说明有一个无法识别的字符。删除有问题的线后,一切都很好。 然后我尝试使用错误行在RDF上使用W3C RDF验证器和Jena,但我得到的是关于未定义语言的一些警告(绝对没有关于错误行)。 你能否建议一种方法(如果可能的话,java)来查找RDF文件中的错误?

修改:有问题的一行是:

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName>

1 个答案:

答案 0 :(得分:1)

您可以使用Sesame的Rio parser进行验证。 this blogpost中有关于如何与力拓一般合作的说明。具体来说,诀窍是创建并附加一个ParseErrorListener,它接收来自解析器的详细警告和错误。

但是,既然你提到你遇到的问题是在SAX / XML级别,你也可以使用通用的XML验证器来查看错误。最可能的原因(但没有更多详细信息很难说)是你在某处有一个编码不正确的字符。