我需要创建一个每日图表/报告,该图表需要计算每天的行数,但是必须过滤10+百万个值。为此,写一个where子句似乎不太可能,因为我将无法过滤数百万个值。
是否存在使用查询执行此操作的方法,或者在ETL过程中必须在上游每天进行数据/行的加载之前将其过滤?
答案 0 :(得分:0)
我将使用带有创建日期的字段(作为日期类型而不是时间戳)。在此字段上创建索引,然后继续使用where子句。这将使数据库能够按日期最佳地进行过滤。一些数据库甚至会跟踪与给定键匹配的记录数。这样做只是使用where子句,并且依赖于DBMS实现的优化。