我正在使用Solr并且它返回了错误500并且它表示在char 139212处有一个无效的utf8中间字节,我怎么能去这个char来查看问题是什么?
答案 0 :(得分:0)
如果你的文件系统上有文件,而且它是Unix / Linux类型的系统,你可以在命令行上尝试这样的事情:
$ head -c 139300 <filename> | tail -c 1000
这告诉head
您希望文件中的第一个139300字节。由于数字139212即将结束,你可以在上下文中看到你的角色,或至少弄清楚它在哪个部分/阻止。因为这是一个很好的数据量,我添加| tail -c 1000
仅显示前139300个字符的最后1000个字节。这样您就不必通过终端滚动尽可能多的数据来查看结果。
如果您自己生成此XML,我建议您添加XML验证或至少非法的字符检测,以便将来可以避免此问题。