Mysql计算重复行的百分比

时间:2012-09-12 13:26:43

标签: mysql count subquery percentage

所以我试图计算每个餐厅系统中重复订单的数量。这被定义为从该餐馆订购了多次的用户数(基于他们的电子邮件地址,eo_email)。架构下的示例

这是代表我的餐馆的表格

CREATE TABLE IF NOT EXISTS `lf_restaurants` (
  `r_id` int(8) NOT NULL AUTO_INCREMENT,
  `r_name` varchar(128) DEFAULT NOT NULL,
  PRIMARY KEY (`r_id`)
) ENGINE=MyISAM  DEFAULT CHARSET=latin1 ;

INSERT INTO `lf_restaurants` (`eo_id`, `eo_ref_id`) VALUES
('1', 'Restaurant X'),
('2', 'Cafe Y');

这是我的订单表

CREATE TABLE IF NOT EXISTS `ecom_orders` (
  `eo_id` mediumint(9) NOT NULL AUTO_INCREMENT,
  `eo_ref_id` varchar(12) DEFAULT NOT NULL,
  `eo_email` varchar(255) DEFAULT NOT NULL,
  `eo_order_parent` int(11) NOT NULL,
  PRIMARY KEY (`eo_id`),
) ENGINE=InnoDB  DEFAULT CHARSET=latin1 ;

INSERT INTO `ecom_orders` (`eo_id`, `eo_ref_id`, `eo_email`, `eo_order_parent`) VALUES
('', '', 'a@a.com', '1'),
('', '', 'a@a.com', '1'),
('', '', 'a@a.com', '1'),
('', '', 'a@a.com', '1'),
('', '', 'a@a.com', '1'),
('', '', 'b@b.com', '1'),
('', '', 'b@b.com', '1'),
('', '', 'c@c.com', '1'),
('', '', 'd@d.com', '1'),
('', '', 'e@e.com', '1'),
('', '', 'a@a.com', '2'),
('', '', 'c@c.com', '2'),
('', '', 'c@c.com', '2'),
('', '', 'e@e.com', '2');

所以餐厅X(r_id 1)有10个订单。用户a@a.com和b@b.com已多次从该餐厅订购,c @ c.com,d @ d.com和e@e.com仅订购一次,因此需要退货40%

Cafe Y(r_id 2)有4个订单。用户c@c.com已订购两次,用户a@a.com和e@e.com只订购一次,因此需要返回33%

我不确定发布我已经获得的内容将会非常好,因为我继续遇到'Subquery有超过1个结果',或者如果我将该子查询包含在它自己的虚拟查询中,并且不会让我使用我需要的主要查询字段,如r_id。但是这里有:

SELECT r_name,
    (SELECT COUNT(*) AS cnt_users
        FROM (
            SELECT *
            FROM ecom_orders
            WHERE eo_order_parent = r_id
            GROUP BY eo_email
        ) AS cnt_dummy
    ) AS num_orders,
    (SELECT COUNT(*) AS cnt
        FROM ecom_orders
        WHERE eo_order_parent = r_id
        GROUP BY eo_order_parent, eo_email

    ) AS num_rep_orders
    FROM lf_restaurants
    ORDER BY num_orders DESC

num_orders子查询说它不识别r_id,因为我猜这是由于执行事物的顺序

num_rep_orders子查询以多行的形式返回,但实际上我希望它只返回一个值,如果我像num_orders子查询一样,我可以这样做,但是会遇到r_id不存在的问题。

所以我的问题是: 如何在不进入子查询的情况下获取我需要的这些值超过1行,并且r_id不存在?

然后从这两个值我可以算出百分比,所有应该是肉汁:)任何帮助非常感谢!

2 个答案:

答案 0 :(得分:2)

  

所以餐厅X(r_id 1)有10个订单。用户a@a.com和b@b.com有   从该餐厅多次订购,并且c@c.com,d @ d.com和   e@e.com只订购一次,因此需要返回40%

     

Cafe Y(r_id 2)有4个订单。用户c@c.com订购了两次用户   a@a.com和e@e.com只订购一次,因此需要退货   33%

好。因此,让我们从获得重复客户的数量开始。

SELECT eo_order_parent, eo_email, COUNT(eo_email) AS orders FROM ecom_orders
    GROUP BY eo_order_parent, eo_email
    HAVING orders > 1;

和不同客户的总数

SELECT eo_order_parent, COUNT(eo_email) FROM ecom_orders
    GROUP BY eo_order_parent;

但我们可以一次性做到这一点:

SELECT eo_order_parent,
    SUM(CASE WHEN orders > 1 THEN 1 ELSE 0 END) AS repeats,
    SUM(1) AS total FROM
    (
        SELECT eo_order_parent, eo_email, COUNT(*) AS orders FROM ecom_orders
            GROUP BY eo_order_parent, eo_email
    ) AS eo_group_1
GROUP BY eo_order_parent;

这给出了:

+-----------------+---------+-------+
| eo_order_parent | repeats | total |
+-----------------+---------+-------+
|               1 |       2 |     5 |
|               2 |       1 |     3 |
+-----------------+---------+-------+
2 rows in set (0.00 sec)

然后2/5是你的40%,而1/3是33%。

答案 1 :(得分:1)

以下查询计算回头客的数量和每家餐厅的客户总数

SELECT
  u.r_id,
  u.r_name,
  SUM(u.no_orders > 1) AS repeats,
  SUM(u.no_orders) AS orders,
  COUNT(u.eo_email) AS customers
FROM (
    SELECT
      r.*,
      o.eo_email,
      COUNT(o.eo_id) AS no_orders
    FROM lf_restaurants r
    LEFT JOIN ecom_orders o ON o.eo_order_parent = r.r_id
    GROUP BY o.eo_email
) u
GROUP BY
  r.r_id;

子查询首先计算每个客户/餐馆对的订单数量。外部查询从中计算客户数量,重复客户数量和每个餐馆的客户总数。您还可以计算百分比(但不必在查询中完成)。