在特定时间间隔的随机结果(根据列数据)

时间:2013-11-11 21:51:51

标签: mysql sql random distance

我在MySQL中有这两个表 - “tag_name”,其中包含每个单独创建的标记的唯一tag_name_id,以及相应的tag
- “标签”,其中还包含唯一的tags_idtimecode(时刻)和group_id(相同的标签可以包含不同的group_id)

现在,我要做的是在前10秒(timecode)的某处随机timecode <= 10。然后,根据提取的时间码,尝试选择距离3秒或更长时间的所有结果。 (必须丢弃所有小于3秒的结果。)

例:
如果我在我的数据库中有这些结果:

2,3,4,4,6,13,14,17,18,18,21,25,28,28,etc (timecodes)  

我想随机抓取前10个中的一个(假设我选择了4个),然后我想根据那个时刻开始随机排序。 (“随机”,因为我想在相同的时间码瞬间出现时更改顺序,即:“4,4”因为它们与不同的标签相关联,所以我希望它们在它们之间“切换”,所以我可以选择另一个每次)
所以结果查询来自这样的:4,13,17,21,25,28等

我已经有了这个查询返回给我的随机数,今天早上我一直试图在Select里面做一个Select,因为我觉得答案就在那里,但是我找不到我想要的结果,而我也无法找到一种方法来检索距离为3的结果......

SELECT tag_name.tag, ROUND(avg(timecode)) as timecode, group_id 
FROM tags
INNER JOIN tag_name
ON tag_name.tag_name_id = tags.tag_name_id
WHERE tags.filename = 'filename.mp4' AND timecode <= 10
GROUP BY  group_id, tag_name.tag
ORDER BY RAND()
LIMIT 1

Here是SQLFiddle

1 个答案:

答案 0 :(得分:0)

所以我们有一个时间码表,为了论证,可能看起来像......

CREATE TABLE timecodes(id INT NOT NULL AUTO_INCREMENT PRIMARY KEY,timecode INT NOT NULL);
INSERT INTO timecodes (timecode) VALUES (2),(3),(4),(4),(6),(13),(14),(17),(18),(18),(21),(25),(28),(28);

 SELECT * FROM timecodes;
 +----+----------+
 | id | timecode |
 +----+----------+
 |  1 |        2 |
 |  2 |        3 |
 |  3 |        4 |
 |  4 |        4 |
 |  5 |        6 |
 |  6 |       13 |
 |  7 |       14 |
 |  8 |       17 |
 |  9 |       18 |
 | 10 |       18 |
 | 11 |       21 |
 | 12 |       25 |
 | 13 |       28 |
 | 14 |       28 |
 +----+----------+

现在,这个问题分为两部分。第一部分涉及从第一个 n 结果中获取随机结果。这样做的一种方式(尽管可能不是最快的方式)就像这样......

 SELECT @seed := x.timecode 
   FROM timecodes x 
   JOIN timecodes y 
     ON y.id <= x.id 
  GROUP 
     BY x.id 
 HAVING COUNT(*) <= 5 
  ORDER 
     BY RAND() 
  LIMIT 1;

+---------------------+
| @seed := x.timecode |
+---------------------+
|                   4 |
+---------------------+

此查询生成种子(在本例中为“4”),可以将其重新投入后续查询,例如;

SELECT @seed := MIN(y.timecode)
  FROM timecodes x
  JOIN timecodes y 
    ON y.timecode >= x.timecode + 3
 WHERE x.timecode = @seed;

1st iteration
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                       13 |
+--------------------------+

2nd iteration    
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                       17 |
+--------------------------+

3rd iteration    
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                       21 |
+--------------------------+

4th iteration    
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                       25 |
+--------------------------+

5th iteration    
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                       28 |
+--------------------------+

6th iteration    
+--------------------------+
| @seed := MIN(y.timecode) |
+--------------------------+
|                     NULL |
+--------------------------+

这可以包含在一个sproc或一些应用程序级代码中,这些代码表示“先做第一件事,而@seed是非NULL,做第二件事” - 但这超出了我的工资等级。