Sphinx返回错误的文档ID

时间:2013-12-06 06:54:49

标签: php mysql sphinx

我的sphinx搜索返回错误的结果,如果我搜索关键字,则返回的文档ID不包含该关键字。

以下是我创建conf设置的方法:

source source_name
{
    type                = mysql

    sql_host            = ******
    sql_user            = ******
    sql_pass            = ******
    sql_db              = ******
    sql_port            =   # optional, default is 3306

    sql_query_pre           = SET CHARACTER_SET_RESULTS=utf8
        sql_query_pre                   = SET NAMES utf8
        sql_query                       = \
                SELECT \
                        P.ID AS ID, P.TITLE AS TITLE, P.TITLE AS TITLE_SORT \
                FROM \
                        PRODUCT P \
                WHERE \
                        P.ISVALID='Y'

    sql_attr_string         = TITLE_SORT

    sql_query_info          = SELECT * FROM PRODUCT WHERE ID=$id
}

index index_name
{
    source              = source_name
    path                = /path/to/data/file_name
    docinfo             = extern
    min_word_len            = 1
    charset_type            = utf-8
}

indexer
{
    mem_limit           = 128M
}

searchd
{
    listen              = 3312 # port is deprecated from 2.1+
    log             = /path/to/log/searchd.log
    query_log           = /path/to/log/query.log
    read_timeout            = 5
    max_children            = 30
    pid_file            = /path/to/log/searchd.pid
    max_matches         = 1000
    seamless_rotate         = 0
    preopen_indexes         = 0
    unlink_old          = 1
    compat_sphinxql_magics      = 0
}

一个重要的事情是如果我使用test.php工具进行搜索,我可以看到属性值显示带有搜索关键字的产品,但文档ID仍然是错误的,这让我觉得它返回错误的原因文件ID

另一个重要的事情是,在同一台机器和同一个conf文件中,我为另一个mysql数据库创建了一个索引,它运行正常。

由于

编辑:

以下是一个例子:

我搜索“专业”,我得到了这个结果

1. doc_id=33285, weight=102, title_sort=Wella Professional Bezoplachový kondicionér pro objem vlasï SP Volumize 150 ml, manufacturer_id=217, category_id=4648, min_price=0, product_rating=4294967295, filter_userid=(2714222508,3149373076)
2. doc_id=33286, weight=102, title_sort=Wella Professional àampon pro lesk vlasï SP Shine Define 250 ml, manufacturer_id=217, category_id=3046113, min_price=0, product_rating=4294967295, filter_userid=(2714222508,3149373076)
3. doc_id=33287, weight=102, title_sort=Wella Professional àampon pro barvené vlasy SP Color Save 250 ml, manufacturer_id=217, category_id=3046113, min_price=0, product_rating=4294967295, filter_userid=(2714222508,3149373076)

..等等..

您可以看到title_sort字段中包含“专业”一词,但返回的doc_ids(33285,33286,33287)不是这些记录。

以下是数据库中的标题数据

33285   Avon Čisticí tonikum na tělo proti akné ve spreji Blemish Clearing 100 ml
33286   Biotherm Pleťový krém a sérum 2v1 pro navrácení pružnosti normální až smíšené pleti Age Fitness Elastic 30 ml AKCE
33287   Avon Dětský šampon Barbie® 200 ml

虽然您在上面的title_sort中看到的结果与这些ID相关联:

32854   Wella Professional Bezoplachový kondicionér pro objem vlasů SP Volumize 150 ml
32855   Wella Professional Šampon pro lesk vlasů SP Shine Define 250 ml
32856   Wella Professional Šampon pro barvené vlasy SP Color Save 250 ml

1 个答案:

答案 0 :(得分:0)

对不起伙计们,问题解决了!我们的托管支持是一个愚蠢的错误。

他们创建了一个新的数据库并将旧的数据库数据传输到其中。旧数据库已损坏。

当我创建原始的重复表然后尝试将其编入索引时,我发现了这一点,sphinx给了我错误,该表不存在,并点击了我的想法,我比较了网站上的数据库设置和sphinx.conf

我没有在任何论坛和谷歌上找到像我这样的问题,除了那个有类似配置问题的问题。 因此,如果您正在阅读此答案以找到类似问题的解决方案,那么您必须检查您的配置并确认您的conf文件指向正确的数据库和表格。这将节省您的时间,可能是几个星期的痛苦:)。