我正在尝试执行以下操作,但我无法将其设置为正确:(。
我有这些表格:
table1 -> tb1_id, tb1_name
Sample Data:
--------------
1 group1
2 group2
3 group3
4 group4
5 group5
table2 -> tb2_id, tb2_sector, tb2_tb3_id
Sample Data:
--------------
1 alpha 1
2 beta 2
3 gamma 2
4 delta 2
5 epsilon 4
table3 -> tb3_id, tb3_mid, tb3_section
Sample Data:
--------------
1 234 alpha,beta,gama,delta
这是我要找的输出:
Name Count %
------ ----- -----
group1 1 25%
group2 3 75%
group3 0 0%
group4 0 0%
group5 0 0%
基本上我需要拆分一个由逗号分隔的列值(table3中的tb3_section),然后为每个值找到正确的组(table2给出了与table1链接的组ID),然后按组进行总计数得到百分比(假设总数是100%)。
这是我到目前为止尝试的查询:
我搜索了分割值样本,并找到了一个通过首先创建数字表进行分割的样本:
create table numbers (
`n` INT(11) SIGNED
, PRIMARY KEY(`n`)
)
INSERT INTO numbers(n) SELECT @row := @row + 1 FROM
(SELECT 0 UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) t,
(SELECT 0 UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) t2,
(SELECT 0 UNION ALL SELECT 1) t8,
(SELECT @row:=0) ti;
之后,我这样做了:
select tb3_section, count(1) from (
select
tb3_mid,
substring_index(
substring_index(tb3_section, ',', n),
',',
-1
) as tb3_section from table3
join numbers
on char_length(tb3_section)
- char_length(replace(tb3_section, ',', ''))
>= n - 1
) tb3_section_dashboard
group by 1
这并没有给我团体计数。只是tb3_section的拆分,但没有给我正确的计数和等效百分比。任何想法都会非常感谢,非常感谢。
最新更新
首先,我要感谢@eggyal指出我正确的方向和@Shadow鄙视我知道我没有采取最好的方法,他想出了一个快速解决我的问题。我设法更改了方法并从table3中删除了逗号分隔值。相反,现在我为每个新值添加多行(并添加了一个约束以避免重复)。
现在 table3 看起来像:
Sample Data:
--------------
1 234 alpha
2 234 beta
3 234 gama
4 234 delta
5 235 alpha
以下是我从@shadow示例中获取的查询:
SELECT t1.tb1_name, COUNT(t3.tb3_section) AS no_per_group,
COUNT(t3.tb3_section) / t4.no_of_groups AS percentage
FROM t1 left
JOIN t2 ON t1.tb1_id=t2.tb2_tb3_id
INNER JOIN t3 ON t2.tb2_sector=t3.tb3_section>0
JOIN (SELECT COUNT(*) AS no_of_groups
FROM t3 INNER JOIN t2 ON t2.tb2_sector=t3.tb3_section>0) t4
GROUP BY t1.tb1_name
现在我使用 = 来匹配确切的值,而不是使用 find_in_set 。 现在我得到类似下面的东西,但百分比看起来很奇怪,我想念一个没有匹配的小组:
Name no_per_group percentage
----- ------------- ----------
group1 2 0.1053
group3 3 0.1579
group4 3 0.1579
group5 3 0.1579
虽然我还需要这样的东西:
Name Count %
------ ----- -----
group1 1 25%
group2 3 75%
group3 0 0%
group4 0 0%
group5 0 0%
请注意,如果组中没有匹配项,我仍需要显示该组。 因为我有成千上万的记录彼此不同,我需要添加另一个条件:其中tb3_mid = 234 。喜欢这个,结果用于tb3_mid。
答案 0 :(得分:2)
最好的解决方案是重新设计表结构,并将分隔值列表中的数据移动到单独的表中。
快速解决方案是利用MySQL的find_in_set()功能。
要获取消息表(表3)中条目的总数:
select count(*) as no_of_groups
from t3 inner join t2 on find_in_set(t2.tb2_sector,t3.tb3_section)>0
要获取每组的计数,请将连接添加到table1并按组名称添加。要计算百分比,请将以上查询添加为子查询:
select t1.tb1_name, count(t3.tb3_section) as no_per_group, count(t3.tb3_section) / t4.no_of_groups as percentage
from t1 left join t2 on t1.tb1_id=t2.tb2_tb3_id
inner join t3 on find_in_set(t2.tb2_sector,t3.tb3_section)>0
join (select count(*) as no_of_groups
from t3 inner join t2 on find_in_set(t2.tb2_sector,t3.tb3_section)>0) t4 --no join condition makes a Cartesian join
group by t1.tb1_name