Sphinx搜索:结果中缺少重音符号/变音符号

时间:2018-10-23 22:59:03

标签: character-encoding sphinx diacritics

我使用Sphinx搜索版本2.2.11。

Sphinx返回的数据不带有重音符号/变音符号,例如“ cerny”而不是“černý”。

即使查询本身具有重音符号,它也将返回正确的项目,只有 结果的编码是错误的。

我知道我以前有这个问题,但是我不记得我是怎么解决的,那是3年前, 我认为当时是2.1版。

也许索引不正确?

我的配置的相关部分:

searchd {
        ...
        collation_server = utf8_general_ci
}

index xxx {
        source = xxxSrc
        path = /var/lib/sphinxsearch/xxx
        charset_table = 0..9, A..Z->a..z, _, a..z, U+0e1->a, U+0c1->a, U+10d->c, U+10c->c,
        U+10f->d, U+10e->d, U+0e9->e, U+0c9->e, U+11b->e, U+11a->e, U+0ed->i, U+0cd->i, U+148->n,
        U+147->n, U+0f3->o, U+0d3->o, U+159->r, U+158->r, U+161->s, U+160->s, U+165->t, U+164->t,
        U+0fa->u, U+0da->u, U+16f->u, U+16e->u, U+0fd->y, U+0dd->y, U+17e->z, U+17d->z,
        index_exact_words = 1
        docinfo = extern
        morphology = stem_cz
        min_stemming_len = 5
        min_infix_len = 3
}

感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

好吧,实际上不是狮身人面像问题,而是在ODBC / Oracle中

此问题已解决

export NLS_LANG="CZECH_CZECH REPUBLIC.AL32UTF8"