在表格中插入并关联重复数据

时间:2017-05-21 21:34:05

标签: php postgresql common-table-expression upsert

我正在postgresql中开发一个简单的问号标签数据库关联。一个问题可以有多个标签,一个标签可以与多个问题相关联。这就是为什么我有一个M-M表,问号。 使用php我想创建一个问题并验证给定的标签是否已经存在于标签表上。如果确实存在:

  • 请勿将我的代码添加到代码表
  • 将预先存在的标记与我的问号表上的问题相关联

如果标签不存在,我想将其添加到tags表中,然后创建一个assoaciation。

为此我尝试了这样的事情:

function update_tags($questionid, $tags) {
    global $conn;

    //Check if question already exists. If Yes, delete it from the array -> //EDIT PROPOSES
    $questiontags = get_all_tags();
    $existant_tags = [];

    foreach ($questiontags as $tag_idx => $tag) {
        if(in_array($tag['name'], $tags)){
            $key = array_search($tag['name'], $tags);
            unset($tags[$key]);
            $existant_tags[] = $tag['tagid'];
            associate_only_tag($tag['tagid'], $questionid);

        }
        $questiontags[$tag_idx] = $tag['tagid'];
    }

    foreach ($tags as $tag) {
        associate_tag($tag, $questionid);
    }

    $tags_to_delete = array_diff($questiontags, $existant_tags);

    foreach ($tags_to_delete as $tagid) {
        delete_tag_from_question($tagid, $questionid);
    }
}

function get_all_tags() {

    global $conn;

    $query=$conn->prepare("SELECT tags.tagid, tags.name FROM tags ");
    $query->execute();

    return $query->fetchAll();

}

function get_tags_from_question($questionid) {
    global $conn;

    $query=$conn->prepare("SELECT tags.tagid, tags.name FROM tags 
INNER JOIN questiontags 
ON tags.tagid = questiontags.tagid
WHERE questiontags.questionid = :question
");
    $query->execute(['question' => $questionid]);

    return $query->fetchAll();
}

function insert_tag($tag)
{
    global $conn;
    $stmt = $conn->prepare("INSERT INTO tags (name) VALUES(:tag)");
    $stmt->execute([$tag]);
    return (int)$conn->lastInsertId();
}

function associate_tag($tag, $questionid)
{
    global $conn;
    $tagid = insert_tag($tag);
    $stmt = $conn->prepare("INSERT INTO questiontags (questionid, tagid) VALUES(:question, :tag)");
    $stmt->execute(['question' => $questionid, 'tag' => $tagid]);
}

function associate_only_tag($tagid, $questionid)
{
    global $conn;
    $stmt = $conn->prepare("INSERT INTO questiontags (questionid, tagid) VALUES(:question, :tag)");
    $stmt->execute(['question' => $questionid, 'tag' => $tagid]);
}

function delete_tag_from_question($tagid, $questionid) {
    global $conn;

    $query = $conn->prepare("DELETE FROM questiontags WHERE questionid = :question AND tagid = :tag");
    $query->execute(['question' => $questionid, 'tag' => $tagid]);
}

问题是这只适用于新问题而不是我更新问题时。当我associate_only_tag时,我需要检查问题是否存在,然后更新而不是尝试创建新行questiontags。经过很多努力,我无法弄明白。

有没有办法实现这个目标?

1 个答案:

答案 0 :(得分:0)

我建议在CTE中使用INSERT ... ON CONFLICT DO NOTHING 单个查询(但要正确!)。
如果要将其包装到函数中,请使用带有VARIADIC输入参数的服务器端SQL函数以方便:

CREATE OR REPLACE FUNCTION update_tags(_questionid int, VARIADIC _tags text[])
  RETURNS void AS
$func$
   WITH ins_tags AS (
      INSERT INTO tags (name) 
      SELECT * FROM unnest(_tags)
      ON     CONFLICT (name) DO NOTHING
      RETURNING tagid
      )
   INSERT INTO questiontags (questionid, tagid)
   SELECT _questionid, i.tagid FROM ins_tags i
   UNION  ALL
   SELECT _questionid, t.tagid FROM tags t
   WHERE  t.name = ANY(_tags)
   ON     CONFLICT (questionid, tagid) DO NOTHING;
$func$  LANGUAGE sql;

这将创建数组(或列表)中尚不存在的所有标记。它将给定的问题与所有问题联系起来 - 除非已经相关联。

它需要表name中的tags和表(questionid, tagid)中的questiontags上的唯一(或PK)约束。两者通常都存在于many-to-many implementation中。否则创建每个。

并假设tags.tagidserial列。也应该是这样的。

呼叫:

SELECT update_tags(123, 'foo', 'bar');

或者:

SELECT update_tags(123, VARIADIC '{foo,bar}'::text[]);

并发写入负载下仍然可能失败(即使非常不可能)。如果您有,请改用ON CONFLICT ... DO UPDATE。详细解释:

关于VARIADIC