我有一个相对较小的数据集,我正在编写IP日志分析,然后对其进行查询。
我每小时都会使用更新的统计信息更新BigQuery。
我有110,000行,37MB数据。
以下查询需要7秒到50秒才能运行:
SELECT SUM(1)as views FROM [statistics.statsLogNSI] WHERE lastedit> DATE_ADD(CURRENT_TIMESTAMP(), - 7,“DAY”)
我的更复杂的查询示例如下:
SELECT SUM(1)作为视图FROM [statistics.statsLogNSI] WHERE NOT 组合包含'isRobot:True'和ownerKey ='14013'和国家/地区 ='US'和lastedit> DATE_ADD(CURRENT_TIMESTAMP(), - 7,“DAY”)
您是否建议优化此结果集?我在BigQuery中看到了之前关于“碎片化”的帖子。每小时更新一次表太频繁了吗?