我已经使用BigQuery大约2个月了。在那段时间里,我使用流式插入每分钟添加数千个条目。然后,我就可以在几分钟内查询这些数据,如果不是立即查询的话。
几天前开始,我的一张桌子突然开始显示数据可用性延迟,从20到60分钟不等。这只发生在我的一个表中。插入其他表格的数据几乎可以立即获得。
BigQuery的这种数据可用性延迟是否正常?
遇到此问题的表格为accuAudience.trackPlays
。我很乐意向Google团队成员提供项目ID和其他信息。
流式插入问题表的结果是:
{'kind':'bigquery#tableDataInsertAllResponse'}
来自有问题的表accuAudience.trackPlays
的示例查询(按日期desc排序):
ROW DATE COUNT
1 2015-03-30 12:35:32 UTC 67
2 2015-03-30 12:35:31 UTC 65
3 2015-03-30 12:35:30 UTC 56
4 2015-03-30 12:35:29 UTC 45
5 2015-03-30 12:35:28 UTC 60
相同的查询在几秒钟之后发送到不同的表(accuAudience.trackSkips
)。请注意,日期字段比先前的查询提前30分钟。
ROW DATE COUNT
1 2015-03-30 13:04:03 UTC 1
2 2015-03-30 13:04:02 UTC 1
3 2015-03-30 13:04:01 UTC 3
4 2015-03-30 13:04:00 UTC 3
5 2015-03-30 13:03:59 UTC 6
如果还需要其他信息,请告诉我们!
答案 0 :(得分:4)
BigQuery定期运行后台维护任务以优化您的表以进行查询。其中一个后台任务引起了流媒体过程的打嗝。这导致我们在刷新之前无法从流缓冲区读取。请注意,当您不断向桌面流式传输时,您可能已经将此视为一个持续存在的问题。
现在修好了。如果您继续看到问题,请告诉我们什么是表&项目你看到了问题。