如何将标签映射到标签同义词?

时间:2015-05-06 12:16:53

标签: javascript mysql sql node.js node-mysql

我正在建立一个用户将标签与帖子关联起来的系统,与SO不同。我正忙着实施tag synonyms

我在这里有一个名为标签

的表格
| TagName    |
|------------|
| Python     |
| JavaScript |
| Node       |

我还有另一个名为 TagSynonyms

| SynonymId | SourceTagName | TargetTagName |
|-----------|---------------|---------------|
| 1         | Py            | Python        |
| 2         | Python2       | Python        |

服务器使用Node实现,用户以逗号分隔的字符串输入一些标签:

var input = 'Py,Flask'
var tags = request.tags.split(',');

在这种情况下,用户输入了 Py 标签,根据 TagSynonyms 表,该标签应映射到 Python 标签。第二个标记 Flask 没有同义词,应该保持不变。

我设法使用命令式代码实现此功能:

tags.forEach(function (tag) {
  connection.query('SELECT TargetTagName FROM TagSynonyms WHERE SourceTagName = ?', tag, function(err, rows) {
    if (rows.length !== 0) {
      console.log(rows[0].TargetTagName);
    } else {
      console.log(tag);
    }
  });
});

这里是用户输入

['Py','Flask'] 

产生以下输出

Python
Flask

我想要做的是,将此逻辑推迟到数据库引擎,因为我认为使用循环是代码气味。我还认为数据库引擎会更高效。执行此操作的适当查询是什么?

1 个答案:

答案 0 :(得分:3)

您需要UNION和加入:

  select TagName
    from Tags
    where TagName in (?,?,?,...)
union
  select TagName
    from Tags
    join TagSynonyms
      on Tags.TagName = TagSynonyms.TargetTagName
    where TagSynonyms.SourceTagName in (?,?,?,...)

请注意,union可能会很慢,因为它会尝试删除重复项。如果是这种情况,请使用union all并删除应用程序代码中的重复项。

(?,?,?,...)代表输入值列表;检查数据库驱动程序文档,了解为避免SQL注入而需要使用的确切语法。

更新:以下是Node中的实现:

var query = 
'SELECT TagName \
FROM Tags \
WHERE TagName IN (?) \
UNION \
SELECT TagName \
FROM Tags \
JOIN TagSynonyms \
  ON Tags.TagName = TagSynonyms.TargetTagName \
WHERE TagSynonyms.SourceTagName IN (?)'

connection.query(query, [tags, tags], function(err, rows) {
  tags = rows.map(function(row) { 
    return row.TagName
  });
});