我有一些RDF文件要导入到一个tripplestore(AllegroGraph),但是在第一个文件中我得到一个SAX解析器错误,说明有一个无法识别的字符。删除有问题的线后,一切都很好。 然后我尝试使用错误行在RDF上使用W3C RDF验证器和Jena,但我得到的是关于未定义语言的一些警告(绝对没有关于错误行)。 你能否建议一种方法(如果可能的话,java)来查找RDF文件中的错误?
修改:有问题的一行是:
<gn:alternateName xml:lang="got">𐌰𐍆𐌲𐌰𐌽𐌹𐍃𐍄𐌰𐌽</gn:alternateName>
答案 0 :(得分:1)
您可以使用Sesame的Rio parser进行验证。 this blogpost中有关于如何与力拓一般合作的说明。具体来说,诀窍是创建并附加一个ParseErrorListener,它接收来自解析器的详细警告和错误。
但是,既然你提到你遇到的问题是在SAX / XML级别,你也可以使用通用的XML验证器来查看错误。最可能的原因(但没有更多详细信息很难说)是你在某处有一个编码不正确的字符。