现实检查Sphinx的SQL查询

时间:2018-03-26 03:48:36

标签: mysql sphinx

我正在将Sphinx作为我网站的搜索服务器。该网站允许教师建立评估项目 - 我希望索引 - 可以包括:

  • 上下文(每个项目一个)
  • 一个或多个问题(每个项目很多)
  • 每个问题的答案(每个问题很多)
  • 每个问题的类别(多对多)

我对Sphinx和MySQL的直接使用都很陌生,因为我的其他搜索都是通过CakePHP的功能进行的。

在构建一个可以将数据库中的问题编入索引的视图时,我提出了以下SQL查询(它很大,但我不会要求你调试它):

SELECT
    questions.id,
    CONCAT(
        IFNULL(questions.context_template, ''),
        IFNULL(context_answers_concat.context_answer_templates, ''),
        IFNULL(parts_concat.full_parts, '')
    ) as full_question,
    parts_concat.all_categories
FROM
    questions
LEFT JOIN(
    SELECT
        question_answers.question_id,
        GROUP_CONCAT(
            question_answers.answer_template
        ) AS context_answer_templates
    FROM
        question_answers
    GROUP BY
        question_answers.question_id
) AS context_answers_concat
ON
    context_answers_concat.question_id = questions.id
LEFT JOIN(
    SELECT
        question_parts.question_id,
        GROUP_CONCAT(
            CONCAT(
                question_parts.question_template,
                IFNULL(answers_concat.answer_templates, '')
            )
        ) AS full_parts,
        GROUP_CONCAT(
            categories_concat.part_categories
        ) AS all_categories
    FROM
        question_parts
    LEFT JOIN(
        SELECT
            question_answers.question_part_id,
            GROUP_CONCAT(
                question_answers.answer_template
            ) AS answer_templates
        FROM
            question_answers
        GROUP BY
            question_answers.question_part_id
    ) AS answers_concat
ON
    answers_concat.question_part_id = question_parts.id
LEFT JOIN(
    SELECT
        question_categories.question_part_id,
        GROUP_CONCAT(DISTINCT categories.type) AS part_categories
    FROM
        question_categories,
        categories
    WHERE
        question_categories.category_id = categories.id
    GROUP BY
        question_categories.question_part_id
) AS categories_concat
ON
    categories_concat.question_part_id = question_parts.id
GROUP BY
    question_parts.question_id
) AS parts_concat
ON
    parts_concat.question_id = questions.id

我在PHPMyAdmin中运行查询,它会生成我期望的视图 - 一个id列,一个包含问题和答案文本的列,以及一个类别列。

我的问题是,因为它太大了,这是一个合理的查询用于在Sphinx中索引这样的东西吗?如果没有,我应该使用Sphinx的其他部分来完成这项工作吗?或者不同的SQL函数?

非常感谢你的指导!

1 个答案:

答案 0 :(得分:1)

只要您对查询的效果满意并且查询返回您需要的内容,我就不会发现任何问题。我看到查询更大,Sphinx / Manticore也很好用。

或者您可以使用实时索引,在这种情况下,您需要将数据插入索引,而不是使用索引器从mysql中获取。

如果您想坚持使用普通索引并使用索引器,请考虑我还建议您考虑将索引拆分为主要部分和增量部分,以便更频繁地重建增量部分。除非您的索引很小且重建时间不大,否则您不必担心这一点。