我的查询以获取最常用的主题标签。
SELECT `hashtag`, COUNT(*) as `value_occurrence` FROM `messages`
WHERE hashtag <> '' AND
GROUP BY `hashtag`
ORDER BY `value_occurrence` DESC
LIMIT 5;
当我首先运行查询时,我遇到了一个错误,它选择了没有任何标签的hashtag组。
msg_id time message username hashtag edited deleted
13 2015-03-02 02:42:05 #h RyleeHarrison h 0 0
12 2015-03-02 02:42:01 #v #h #d RyleeHarrison v,h,d 0 0
11 2015-03-02 02:38:40 Hello RyleeHarrison 0 0
10 2015-02-28 19:18:40 wqeqewe VikkuP 0 0
9 2015-02-28 19:17:39 cfghjvb pballa8 0 0
8 2015-02-28 19:08:46 Herro... Jared.pw 0 0
7 2015-02-28 15:37:31 hi RyleeHarrison 0 1
6 2015-02-27 21:59:43 hi RyleeHarrison 0 1
1 2015-02-25 21:50:22 #tag RyleeHarrison tag 0 0
返回
hashtag value_occurrence
6
v,h,d 1
h 1
tag 1
另一个问题是带有多个主题标签的邮件用,
分隔,这是一个问题...我需要获取最常用的主题标签,而不是NULL
并且需要识别分隔标记,
的组。如果你可以改进我的代码,那就更好了。