我有一个谷歌应用引擎应用程序,必须处理大量的数据收集。我收集的数据是每天数百万条记录。正如我所看到的,有两种简单的方法可以解决这个问题,以便能够分析数据:
有没有更好的方法呢?
谢谢!
答案 0 :(得分:4)
BigQuery有一个新的Streaming API,他们声称这是为大量实时数据收集而设计的。
来自实践的建议:我们目前通过方法1记录每天20M +多事件记录,如上所述。它工作得很好,除非没有调用批量上传器(通常每5分钟),然后我们需要检测这个并重新运行导入器。 此外,我们目前正在迁移到新的Streaming API,但还没有投入生产,所以我不能说它有多可靠。