我有一个存储过程,每天插入几条记录。每天执行相同的逻辑但是以顺序方式执行。所以为了提高性能,我想要引入并行性。那么是否有一种方法或某些人可以指出一些例子,我可以在存储过程中并行运行一些逻辑。
编辑: 我在存储过程中使用的查询是:
INSERT INTO tmp (time_interval, cnt, dat, txn_id) SELECT DATE_FORMAT(d.timeslice, '%H:%i') as time_interval
, COUNT(m.id) as cnt
, date(d.timeslice) as dat
, "test" as txn_id
FROM ( SELECT min_date + INTERVAL n*60 MINUTE AS timeslice
FROM ( SELECT DATE('2015-05-04') AS min_date
, DATE('2015-05-05') AS max_date) AS m
CROSS
JOIN numbers
WHERE min_date + INTERVAL n*60 MINUTE < max_date
) AS d
LEFT OUTER
JOIN mytable AS m
ON m.timestamp BETWEEN d.timeslice
AND d.timeslice + INTERVAL 60 MINUTE
GROUP
BY d.timeslice;
此查询按小时为每天分组记录,并在tmp表中插入。因此,我希望每天并行运行此查询,而不是顺序运行。
感谢。
答案 0 :(得分:1)
d
是一组代表一天24小时的DATETIME吗?我的直觉说它可以简化一堆。可以通过添加WHERE n BETWEEN 0 AND 23
加快速度。也许:
SELECT '2015-05-04' + INTERVAL n*60 MINUTE AS timeslice
FROM numbers
WHERE n BETWEEN 0 AND 23
mytable
中的内容是什么?特别是,“旧”数据是静态的还是变化的?如果它不变,为什么要反复重新计算呢?仅计算最后一小时,将其存储到永久(不是tmp)表中。不需要并行性。
如果数据发生变化,最好避免
ON m.timestamp BETWEEN d.timeslice
AND d.timeslice + INTERVAL 60 MINUTE
因为(我认为)它不会很好地优化。我们来看看EXPLAIN SELECT...
。
在这种情况下,使用存储过程来计算开始和结束时间,并使用常量构造(考虑CONCAT
)ON子句。
回到你的问题...... MySQL本身无法获得并行性。您可以编写单独的脚本来执行并行操作,每个脚本都有自己的参数和连接。