Question

我正在寻找具有约100万条记录的数据库中的模式。我一直在使用Keras和TensorFlow进行实验，特别是LSTM，

但是，由于我是该领域的新手，因此在进行一些非常具体的查询时我发现了更好的结果。

具有具有以下数据的下表：

SELECT SUM(n)
FROM (
SELECT *, IF(value < 2, @nvalue := 1, @nvalue := 2) AS n
FROM crawler
ORDER BY round DESC
LIMIT 0, 100
) AS sub

如您所见，我将所有低于2的值分类为“ L”（低）值，将较大的分类为H（高）值。

所以这里的主要目标是尝试预测下一个值。

我一直在使用此查询，该查询求和100个值，将高值视为2，将低值视为1。下面的查询求和最后100个结果，并提供一个数字作为输出，假设该数字低于中位数，我们可以预测高价值的机会会增加。

SELECT round, value, class, creacion, sum(n)
FROM (
SELECT *, if(value < 2, @nvalue := 1, @nvalue := 2) AS n
FROM crawler
ORDER BY round DESC
LIMIT 0, 100
) AS sub

因此，第一个问题与查询有关：

我想创建一个新列，将前100个值的总和相加。你知道怎么做吗？

我可以通过以下查询复制结果：

round   value   class   creacion                sum(n)
560894  3.24    hi      2018-06-22 22:58:59     162

但是，它显然仅显示最后一条记录：

public class Params {
    private String dataType;
    private Map<String, List<String>> group;
    private List<Aggregate> aggregates;
    private List<String> scene;
    private List<String> company;
    private List<Map<String, List<String>>> fit;
    private Map<String, String> params;
    private String tempo;
    private String id;
    private String valuation;
}

当我实际上在寻找相同的结果时，但是每条记录都有一个限制，以避免长时间加载。

Answer 1

获取最后一百个值的简单方法是：

select c.*,
       (select sum(c2.value)
        from (select c3.*
              from c3
              where c3.creation <= c.creation
              order by c3.creation desc
              limit 100
             ) c2
       ) as sum_last100
from crawler c;

由于相关子句的层次很深，因此MySQL不接受。

在MySQL 8+中，这要容易得多：

select c.*,
       sum(value) over (order by creation rows between 99 preceding and current row) as sum_last100
from crawler c;

在这一点上，我可能建议您切换到MySQL 8或其他数据库（例如Postgres）。在旧版本的MySQL中，让您所需的查询有效地处理一百万行可能不值得。

一个简单的mySQL查询+统计分析

1 个答案: