单个表的“多个”JOIN的成本是多少,以便具有可变列

时间:2013-08-25 12:48:21

标签: mysql sql database query-optimization

我需要在Mysql数据库中拥有变量列。我使用一个替代方法,即拥有一个帮助meta_data表。我在meta_data的每一行中存储变量列。 meta_data的结构是:

CREATE TABLE IF NOT EXISTS `data_meta` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `data_id` int(11) DEFAULT NULL,
  `meta_key` varchar(200) CHARACTER SET utf8 DEFAULT NULL,
  `meta_value` text CHARACTER SET utf8,
  PRIMARY KEY (`id`),
  KEY `data_id` (`data_id`)
) ENGINE=InnoDB  DEFAULT CHARSET=latin1 AUTO_INCREMENT=347 ;

我需要查询其中一些变量列。所以我的问题是Mysql中这种语句的成本是多少:

select * 
from data
join data_meta as data_prov on (data.id=data_prov.data_id)
join data_meta as data_city on (data.id=data_city.data_id)
join data_meta as data_price on (data.id=data_price.data_id)
.
.
.
.

如果在现实世界中,这可能导致我的查询非常慢,是否有variable columns的替代方案?

注意datameta_data都可以快速增长

1 个答案:

答案 0 :(得分:2)

如果您的数据索引正确,那么多个连接应该不是问题。在这种情况下,您需要data_meta(data_id, meta_key)甚至data_meta(data_id, meta_key, meta_value)

上的索引

顺便说一句,我认为你将meta_key排除在逻辑

之外
select * 
from data
join data_meta as data_prov on (data.id=data_prov.data_id and data_prov.meta_key = 'prov')
join data_meta as data_city on (data.id=data_city.data_id and data_city.meta_key = 'city')
join data_meta as data_price on (data.id=data_price.data_id and data_price.meta_key = 'price')

假设每个键只有一个匹配项,您也可以执行以下查询:

select d.*,
       max(case when dm.meta_key = 'prov' then dm.meta_value end) as prov,
       . . .
from data join
     data_meta dm
     on d.id = dm.id
group by d.id;

如果要获取一个元键的值,这没关系。但是,MySQL往往比聚合更快地进行连接,因此连接方法通常可能更快。

编辑:

要使此查询快速运行,您需要能够快速查找元值。在MySQL中,最好的方法是使用索引。这允许MySQL快速查找元数据中的值。其他数据库支持称为并行散列连接的技术,这也可以加快查询速度(并行散列聚合可以加快组的速度)。这些不是MySQL中的选项,因此您希望使用索引。