Solr vs文档编码问题

时间:2011-08-25 03:28:32

标签: java character-encoding solr

我正在使用solrj 1.4。我的solrj没有正确索引utf-16编码的文档。我想当它试图转换为unicode时,它会用unicode可替换字符U + FFFD替换有问题的utf-16代理键。任何人都可以指导我如何配置solrj 1.4索引/搜索utf-16文件以及utf-8?

1 个答案:

答案 0 :(得分:1)

Solr索引是utf-8(Why don't International Characters Work)。为了能够使用其他编码进行搜索,您始终可以在软件接口Solr中执行翻译。