我有一个用户访问会话表,用于记录网站访问者活动:
accessid, userid, date, time, url
我正在尝试检索用户ID 1234的所有不同会话,以及每个不同会话的最早日期和时间。
SELECT
DISTINCT accessid,
date,
time
FROM
accesslog
WHERE userid = '1234'
GROUP BY accessid
这为我提供了每个不同accessid中随机行的日期和时间。我已经阅读了一些建议使用min()和max()的帖子,所以我尝试了:
SELECT DISTINCT accessid, MIN(DATE) AS date, MIN(TIME) AS time FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC
......甚至......
SELECT DISTINCT accessid, MIN(CONCAT(DATE, ' ', TIME)) AS datetime FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC
...但我从来没有得到最早的日期和时间的正确结果。
订购此类查询的技巧是什么?
编辑 -
发生了一些奇怪的事情....
Bill Karwin在下面发布的代码正确地检索了2009-09开始的会话的最早日期和时间。但是,对于在2009-08某天开始的会议,当前月份发生的第一次点击的时间和日期是返回的。换句话说,查询似乎没有跨越几个月!
示例数据集:
accessid | userid | date | time
1 | 1234 | 2009-08-15 | 01:01:01
1 | 1234 | 2009-09-01 | 12:01:01
1 | 1234 | 2009-09-15 | 13:01:01
2 | 1234 | 2009-09-01 | 14:01:01
2 | 1234 | 2009-09-15 | 15:01:01
至少在我的实际数据表中,下面发布的查询会找到以下最早两个accessid的日期和时间:
accessid | userid | date | time
1 | 1234 | 2009-09-01 | 12:01:01
2 | 1234 | 2009-09-01 | 14:01:01
...我猜想accessid 2的结果看起来正确的唯一原因是因为它在前一个月没有点击。
我疯了吗?
编辑2 -
答案是肯定的,我疯了。当放置在具有重复结构的表中时,该查询将对上述样本数据起作用。
这是(截断的)原始数据。我包括了第一次打击,同月的另一次打击,下个月的第一次打击,然后是本月的最后一次打击。原始数据集在这些点之间有更多的匹配,总共462行。
accessid | date | time
cbb82c08d3103e721a1cf0c3f765a842 | 2009-08-18 | 04:01:42
cbb82c08d3103e721a1cf0c3f765a842 | 2009-08-23 | 23:18:52
cbb82c08d3103e721a1cf0c3f765a842 | 2009-09-17 | 05:12:16
cbb82c08d3103e721a1cf0c3f765a842 | 2009-09-18 | 06:29:59
...查询返回2009-09-17值作为查询原始表时的最早值。但是,当我复制........哦,球。
这是因为2009-08%的点击量有一个空的userid
字段。
答案 0 :(得分:4)
这是每周多次在StackOverflow上出现的“每组最大n”问题的变体。
SELECT
a1.accessid,
a1.date,
a1.time
FROM
accesslog a1
LEFT OUTER JOIN
accesslog a2
ON (a1.accessid = a2.accessid AND a1.userid = a2.userid
AND (a1.date > a2.date OR a1.date = a2.date AND a1.time > a2.time))
WHERE a1.userid = '1234'
AND a2.accessid IS NULL;
这种方法的工作方式是我们尝试找到一个具有相同accessid和userid的行(a2),以及比行a1更早的日期或时间。当我们找不到更早的行时,a1必须 最早的行。
重新评论,我只是尝试了您提供的示例数据。这是我得到的:
+----------+------------+----------+
| accessid | date | time |
+----------+------------+----------+
| 1 | 2009-08-15 | 01:01:01 |
| 2 | 2009-09-01 | 14:01:01 |
+----------+------------+----------+
我在Mac OS X上使用MySQL 5.0.75。
答案 1 :(得分:0)
试试这个
SELECT
accessid,
date,
time
FROM
accesslog
WHERE userid = '1234'
GROUP BY accessid
HAVING MIN(date)
对于userid ='1234',它将以最短的时间返回所有唯一访问。