MySql拆分查询组百分比

时间:2016-08-23 14:20:23

标签: c# mysql stored-procedures

我正在尝试执行以下操作,但我无法将其设置为正确:(。

我有这些表格:

table1 -> tb1_id, tb1_name 

Sample Data:
--------------
1  group1
2  group2
3  group3
4  group4
5  group5

table2 -> tb2_id, tb2_sector, tb2_tb3_id   

Sample Data:
--------------
1  alpha   1
2  beta    2
3  gamma   2
4  delta   2
5  epsilon 4

table3 -> tb3_id, tb3_mid, tb3_section 

Sample Data:
--------------
1   234   alpha,beta,gama,delta

这是我要找的输出:

Name    Count     %
------  -----    -----
group1   1       25%
group2   3       75%
group3   0       0%
group4   0       0%
group5   0       0%

基本上我需要拆分一个由逗号分隔的列值(table3中的tb3_section),然后为每个值找到正确的组(table2给出了与table1链接的组ID),然后按组进行总计数得到百分比(假设总数是100%)。

这是我到目前为止尝试的查询:

我搜索了分割值样本,并找到了一个通过首先创建数字表进行分割的样本:

create table numbers (
  `n` INT(11) SIGNED 
  , PRIMARY KEY(`n`)
) 

INSERT INTO numbers(n) SELECT @row := @row + 1 FROM 
(SELECT 0 UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) t,
(SELECT 0 UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) t2, 
(SELECT 0 UNION ALL SELECT 1) t8, 
(SELECT @row:=0) ti;

之后,我这样做了:

select tb3_section, count(1) from ( 
  select 
    tb3_mid, 
    substring_index(
      substring_index(tb3_section, ',', n), 
      ',', 
      -1
    ) as tb3_section  from table3 
  join numbers
    on char_length(tb3_section) 
      - char_length(replace(tb3_section, ',', '')) 
      >= n - 1
) tb3_section_dashboard
group by 1

这并没有给我团体计数。只是tb3_section的拆分,但没有给我正确的计数和等效百分比。任何想法都会非常感谢,非常感谢。

最新更新

首先,我要感谢@eggyal指出我正确的方向和@Shadow鄙视我知道我没有采取最好的方法,他想出了一个快速解决我的问题。我设法更改了方法并从table3中删除了逗号分隔值。相反,现在我为每个新值添加多行(并添加了一个约束以避免重复)。

现在 table3 看起来像:

Sample Data:
--------------
1   234   alpha
2   234   beta
3   234   gama
4   234   delta
5   235   alpha

以下是我从@shadow示例中获取的查询:

SELECT t1.tb1_name, COUNT(t3.tb3_section) AS no_per_group,
COUNT(t3.tb3_section) / t4.no_of_groups AS percentage 
FROM t1 left
JOIN t2 ON t1.tb1_id=t2.tb2_tb3_id 
INNER JOIN t3 ON t2.tb2_sector=t3.tb3_section>0 
JOIN (SELECT COUNT(*) AS no_of_groups
       FROM t3 INNER JOIN t2 ON t2.tb2_sector=t3.tb3_section>0) t4 
GROUP BY t1.tb1_name

现在我使用 = 来匹配确切的值,而不是使用 find_in_set 。 现在我得到类似下面的东西,但百分比看起来很奇怪,我想念一个没有匹配的小组:

Name        no_per_group     percentage
-----       -------------    ----------
group1      2                0.1053
group3      3                0.1579
group4      3                0.1579
group5      3                0.1579

虽然我还需要这样的东西:

Name    Count     %
------  -----    -----
group1   1       25%
group2   3       75%
group3   0       0%
group4   0       0%
group5   0       0%

请注意,如果组中没有匹配项,我仍需要显示该组。 因为我有成千上万的记录彼此不同,我需要添加另一个条件:其中tb3_mid = 234 。喜欢这个,结果用于tb3_mid。

1 个答案:

答案 0 :(得分:2)

最好的解决方案是重新设计表结构,并将分隔值列表中的数据移动到单独的表中。

快速解决方案是利用MySQL的find_in_set()功能。

要获取消息表(表3)中条目的总数:

select count(*) as no_of_groups
from t3 inner join t2 on find_in_set(t2.tb2_sector,t3.tb3_section)>0

要获取每组的计数,请将连接添加到table1并按组名称添加。要计算百分比,请将以上查询添加为子查询:

select t1.tb1_name, count(t3.tb3_section) as no_per_group, count(t3.tb3_section) / t4.no_of_groups as percentage
from t1 left join t2 on t1.tb1_id=t2.tb2_tb3_id
inner join t3 on find_in_set(t2.tb2_sector,t3.tb3_section)>0
join (select count(*) as no_of_groups
      from t3 inner join t2 on find_in_set(t2.tb2_sector,t3.tb3_section)>0) t4  --no join condition makes a Cartesian join
group by t1.tb1_name